跳至主要内容

【转】vivi开发笔记(二十):vivi延时函数实现不合理性的探讨

文章说明:calmarrow(lqm)原创

文章引自:http://piaoxiang.cublog.cn

 
    vivi实现了两个延时函数:udelay和mdelay。前者是微秒级,后者是毫秒级。对于一般应用已经可以了。但是在分析其实现过程中,发现其设计是不合理的。在探讨过程中,把中断的层次概念弄清晰了,算是额外的收获。下面展开具体分析。
 

#ifndef _VIVI_TIME_H_
#define _VIVI_TIME_H_

#include "config.h"

#ifndef __ASSEMBLY__
void init_time(void);
void mdelay(unsigned int);
void udelay(unsigned int);
#endif

#endif /* _VIVI_TIME_H_ */

 
    udelay和mdelay类似。现在以udelay为主线。首先,声明是在【include/time.h】中,如上所示。然后追踪其定义,利用source insight很容易找到。发现其核心的处理部分是在【arch/s3c2410/proc.c】中,如下:
 

static void
time_wait(unsigned int sec, int unit)
{
    unsigned long ticks, clock_tick_rate;

    /* clear interupt bit */
    SRCPND |= INT_TIMER4;
    INTPND |= INT_TIMER4;
    INTMSK &= ~INT_TIMER4;            /* enable timer 4 interrupt */

    clock_tick_rate = get_clock_tick_rate();
    if (clock_tick_rate == 0) {
        printk("Can not get a clock tick rate\n");
        return;
    }

    if (unit == 0) {
        ticks = (clock_tick_rate * (sec)) / (1000 * 1000);
    } else {
        ticks = (clock_tick_rate * (sec)) / (1000);
    }

    TCNTB4 = ticks;
    TCON = (TCON_4_UPDATE | COUNT_4_OFF);    /* load counter value */

    TCON = (COUNT_4_ON);            /* start timer */

    while (!(INTPND & INT_TIMER4)) ;
    
    TCON = (COUNT_4_OFF);            /* stop timer */

    INTMSK |= INT_TIMER4;            /* mask timer 4 interrupt */
    /* clear interupt bit */
    SRCPND |= INT_TIMER4;
    INTPND |= INT_TIMER4;
}

 
    很明显的步骤:
 
    ・开启中断标志
    ・设置初值
    ・设置模式,开启定时器
    ・查询,直到中断产生,即表示时间到
    ・关定时器,清中断信号
 
    这个函数很奇怪。虽然开启了中断,却不使用中断处理函数,而是查询的方式。知道vivi的中断向量表对IRQ的处理都是死循环,而这个延时函数却能够很好的运行。
 
    为什么?原因就在于中断的分层控制机制。
 
    中断控制可以理解为两层控制。最顶层的中断控制是cpu的中断控制,即cpsr寄存器,可以控制IRQ、FIQ中断的开启或关闭。这是最顶层的,没有比这更高的了。第二层就是SoC自己实现的中断控制器,当然可能有两级甚至多级中断控制。它实现产生中断信号,并将这个中断信号送到cpu,进行处理。所以也比较明显,如果cpsr的I位没有使能,那么第二层产生了信号,送达cpu,但是cpu是置之不理的。从硬件的角度看,中断控制的层次就理顺了。上面这个问题就比较容易理解了。
 
    通过上述分析,得知这个函数的实现是很差的,需要改写。好的方式应该是关中断,只关注定时器,实现对时间的管理,实现相应的延时处理。或者采用中断方式处理,处理部分放到中断服务程序中。不过bootloader还是不用中断方便些。
 
    记在此处,备忘。以后分析中断要基于这个层次模型来分析。另外,要把vivi延时机制改写。
 

 
补记:
 
    借鉴U-boot-1.2.0改进了vivi的延时机制。U-boot并没有采用中断的方式,而是采用查询的方法。对bootloader来说,完成的任务并不复杂,使用查询可以减少中断处理的复杂度。
 
    vivi延时机制的改进patch如下(基本采用U-boot的代码,作出了稍许的改动):
 

[armlinux@lqm patch]$ cat vivi_timer.patch
diff -urN vivi-0.1.4.orig/arch/s3c2410/proc.c vivi/arch/s3c2410/proc.c
--- vivi-0.1.4.orig/arch/s3c2410/proc.c 2003-01-30 23:46:11.000000000 +0800
+++ vivi/arch/s3c2410/proc.c 2007-10-02 14:17:53.000000000 +0800
@@ -261,75 +261,123 @@
        return (freq / (prescale + 1) / divider);
 }
 
-static void
-time_wait(unsigned int sec, int unit)
+int timer_load_val = 0;
+static ulong timestamp;
+static ulong lastdec;
+
+static void
+init_timer4(void)
 {
- unsigned long ticks, clock_tick_rate;
+
/*
+ * use PWM Timer4 because it has no output
+ * prescaler for Timer 4 is 15.
+ *
+ * Notice: TCFG0 configured by init_time();
+ */

+ if (timer_load_val == 0) {
+
/*
+ * 10ms clock period, clock frequency is 100Hz
+ * prescaler = 15 and divider = 1/2
+ * so timer_load_val should be 15625 if PCLK is 50MHz
+ *
+ * Formula:
+ * [Timer input clock Frequency = PCLK/{prescaler value+1}/{divider value}]
+ */

+ timer_load_val = get_bus_clk(GET_PCLK)/(2 * (15 + 1) * 100);
+ printk("Timer4: 10ms and timer_load_val is %d!\n", timer_load_val);
+ }
+
+ /* load value for 10ms timeout */
+ lastdec = TCNTB4 = timer_load_val;
+ /* auto load, manual update of Timer 4 */
+ TCON = (TCON & ~0x00700000) | 0x00600000;
+ TCON = (TCON & ~0x00700000) | 0x00500000;
+ timestamp = 0;
+}
 
- /* clear interupt bit */
- SRCPND |= INT_TIMER4;
- INTPND |= INT_TIMER4;
- INTMSK &= ~INT_TIMER4; /* enable timer 4 interrupt */
+/* macro to read the 16 bit timer */
+static inline ulong READ_TIMER(void)
+{
+ return (TCNTO4 & 0xffff);
+}
 
- clock_tick_rate = get_clock_tick_rate();
- if (clock_tick_rate == 0) {
- printk("Can not get a clock tick rate\n");
- return;
- }
+
/*
+ * timer without interrupts
+ */

 
- if (unit == 0) {
- ticks = (clock_tick_rate * (sec)) / (1000 * 1000);
+void reset_timer_masked(void)
+{
+ /* reset time */
+ lastdec = READ_TIMER();
+ timestamp = 0;
+}
+
+ulong get_timer_masked(void)
+{
+ ulong now = READ_TIMER();
+
+ if (lastdec >= now) {
+ /* normal mode */
+ timestamp += lastdec - now;
        } else {
- ticks = (clock_tick_rate * (sec)) / (1000);
+ /* we have an overflow ... */
+ timestamp += lastdec + timer_load_val - now;
        }
+ lastdec = now;
 
- TCNTB4 = ticks;
- TCON = (TCON_4_UPDATE | COUNT_4_OFF); /* load counter value */
+ return timestamp;
+}
 
- TCON = (COUNT_4_ON); /* start timer */
+void reset_timer(void)
+{
+ reset_timer_masked();
+}
 
- while (!(INTPND & INT_TIMER4)) ;
-
- TCON = (COUNT_4_OFF); /* stop timer */
+ulong get_timer(ulong base)
+{
+ return get_timer_masked() - base;
+}
 
- INTMSK |= INT_TIMER4; /* mask timer 4 interrupt */
- /* clear interupt bit */
- SRCPND |= INT_TIMER4;
- INTPND |= INT_TIMER4;
+void set_timer(ulong t)
+{
+ timestamp = t;
 }
 
-static void
-time_delay(unsigned int sec, int unit)
+
/*
+ * type
+ * 0 -- usec
+ * 1 -- msec
+ */

+void delay(ulong time, unsigned char type)
 {
- unsigned int remain = sec;
+ ulong tmo;
+ ulong start = get_timer(0);
 
- while (remain > 0) {
- if (remain > 40) {
- sec = 40;
+ if (time >= 1000) {
+ tmo = time / 1000;
+ tmo *= (timer_load_val * 100);
+ if (!type) {
+ tmo /= 1000;
+ }
+ } else {
+ tmo = time * (timer_load_val * 100);
+ if (type) {
+ tmo /= 1000;
                } else {
- sec = remain;
+ tmo /= (1000 * 1000);
                }
- time_wait(sec, unit);
- remain -= sec;
        }
-}
-
-void
-arch_udelay(unsigned int usec)
-{
- time_delay(usec, 0);
-}
 
-void
-arch_mdelay(unsigned int msec)
-{
- time_delay(msec, 1);
+ while ((ulong)(get_timer_masked() - start) < tmo) {
+ /* NOP */;
+ }
 }
 
 void
 init_time(void)
 {
        TCFG0 = (TCFG0_DZONE(0) | TCFG0_PRE1(15) | TCFG0_PRE0(0));
+       init_timer4();
 } 

 
    现在看来,无论是bootloader还是kernel,延时是必不可少的组成部分。采取的方法无非有两种:一种是采用关闭中断、打开定时器的方法实现,软件查询,占用CPU的时间比较多,适用于事件并不复杂,并发性要求不高的地方;另一种就是采用中断实现,利用中断服务例程来处理到时操作,占用的CPU时间少。这两种方法在不同的情况下,还可以采用一些辅助机制,比如有限状态机的编程处理方法,来增强对多事件的并行处理能力。
 
    对vivi的了解逐步深入,发现vivi算是一个比较粗糙的产品,其代码的组织虽然脱胎于kernel,但是离U-boot、Linux kernel等优秀的软件来说,还差的太远。在这种情况下,要么推导重来,自己依据此框架完全实现一个bootloader,要么依据此架构,用学习的态度增加功能,尽量不变动原有的代码。第一种情况并不可取,因为可以学习U-boot,掌握精通,足以应付各种需求。第二种情况适合于学习,最终会过渡到U-boot上。其实,所有的这些学习都是基础,而对bootloader的编写和移植,要点一是对SoC的了解,对体系结构的了解,二是就是无OS的驱动程序的编写和移植。其他的就没有什么困难的了。
 
    深入的去学习bootloader,对自己各个方面都是一个巩固和提高的过程。还是那句话,现在就是打基础,打好基础!慢慢来。。。

评论

此博客中的热门博文

【转】AMBA、AHB、APB总线简介

AMBA 简介 随着深亚微米工艺技术日益成熟,集成电路芯片的规模越来越大。数字IC从基于时序驱动的设计方法,发展到基于IP复用的设计方法,并在SOC设计中得到了广泛应用。在基于IP复用的SoC设计中,片上总线设计是最关键的问题。为此,业界出现了很多片上总线标准。其中,由ARM公司推出的AMBA片上总线受到了广大IP开发商和SoC系统集成者的青睐,已成为一种流行的工业标准片上结构。AMBA规范主要包括了AHB(Advanced High performance Bus)系统总线和APB(Advanced Peripheral Bus)外围总线。   AMBA 片上总线        AMBA 2.0 规范包括四个部分:AHB、ASB、APB和Test Methodology。AHB的相互连接采用了传统的带有主模块和从模块的共享总线,接口与互连功能分离,这对芯片上模块之间的互连具有重要意义。AMBA已不仅是一种总线,更是一种带有接口模块的互连体系。下面将简要介绍比较重要的AHB和APB总线。 基于 AMBA 的片上系统        一个典型的基于AMBA总线的系统框图如图3所示。        大多数挂在总线上的模块(包括处理器)只是单一属性的功能模块:主模块或者从模块。主模块是向从模块发出读写操作的模块,如CPU,DSP等;从模块是接受命令并做出反应的模块,如片上的RAM,AHB/APB 桥等。另外,还有一些模块同时具有两种属性,例如直接存储器存取(DMA)在被编程时是从模块,但在系统读传输数据时必须是主模块。如果总线上存在多个主模块,就需要仲裁器来决定如何控制各种主模块对总线的访问。虽然仲裁规范是AMBA总线规范中的一部分,但具体使用的算法由RTL设计工程师决定,其中两个最常用的算法是固定优先级算法和循环制算法。AHB总线上最多可以有16个主模块和任意多个从模块,如果主模块数目大于16,则需再加一层结构(具体参阅ARM公司推出的Multi-layer AHB规范)。APB 桥既是APB总线上唯一的主模块,也是AHB系统总线上的从模块。其主要功能是锁存来自AHB系统总...

【转】C++/CLI程序进程之间的通讯

 现在,把大型软件项目分解为一些相交互的小程序似乎变得越来越普遍,程序各部分之间的通讯可使用某种类型的通讯协议,这些程序可能运行在不同的机器上、不同的操作系统中、以不同的语言编写,但也有可能只在同一台机器上,实际上,这些程序可看成是同一程序中的不同线程。而本文主要讨论C++/CLI程序间的通讯,当然,在此是讨论进程间通讯,而不是网络通讯。    简介   试想一个包含数据库查询功能的应用,通常有一个被称为服务端的程序,等待另一个被称为客户端程序发送请求,当接收到请求时,服务端执行相应功能,并把结果(或者错误信息)返回给客户端。在许多情况中,有着多个客户端,所有的请求都会在同一时间发送到同一服务端,这就要求服务端程序要更加高级、完善。   在某些针对此任务的环境中,服务端程序可能只是众多程序中的一个程序,其他可能也是服务端或者客户端程序,实际上,如果我们的数据库服务端需要访问不存在于本机的文件,那么它就可能成为其他某个文件服务器的一个客户端。一个程序中可能会有一个服务线程及一个或多个客户线程,因此,我们需小心使用客户端及服务端这个术语,虽然它们表达了近似的抽象含义,但在具体实现上却大不相同。从一般的观点来看,客户端即为服务端所提供服务的"消费者",而服务端也能成为其他某些服务的客户端。    服务端套接字   让我们从一个具体有代表性的服务端程序开始(请看例1),此程序等待客户端发送一对整数,把它们相加之后返回结果给客户端。   例1: using namespace System; using namespace System::IO; using namespace System::Net; using namespace System::Net::Sockets; int main(array<String^>^ argv) { if (argv->Length != 1) { Console::WriteLine("Usage: Server port"); Environment::Exit(1); } int port = 0; try { port = Int32::Parse(argv[0]); } catch (FormatException^ e) { Console::Wri...

【转】VxWorks入门

1.VxWorks开发方式:交叉开发,即将开发分为主机(host)和目标机(target)两部分。 类似于dos下C语言程序的开发。 合并开发的优点:简单 缺点:资源消耗量大,CPU支持,非标准体系的支持 host (Tornado) target(vxWork) 小程序模块 vxWorks实际采用开发模式 Tornado提供:编辑,编译,调试,性能分析工具,是vxWorks的开发工具 vxWorks:面向对象可以剪裁的实际运行操作系统 2.vxWorks启动方式 <1>Rom方式 (vxWork_rom) vxWorks直接烧入rom <2>Rom引导方式(bootrom+vxWorks) 其中bootrom烧入rom,vxWorks可以通过从串口,网口,硬盘,flash等下载!这里的bootrom不是开发环境中的bootable,在开发环境里bootable指的是vxWorks,downloadable指application 3.调试 <1>attachs/20060907_164540_564.rar 用来在多任务调试时将调试对象绑定到某个任务 <2>任务级调试(attachs/20060907_164540_564.rar taskName) 单个任务的调试不会影响到其他任务的运行,主要用来调用户的应用程序。 全局断点:在调另一任务或本任务时,系统运行本任务断点,则停下。各任务要配合使用。 任务断点:调本任务时,系统运行到本任务断点,则停下。如果没有attachs/20060907_164540_564.rar到本任务,不起作用。 一次性断点:跑到一次之后自动删除。 <3>系统级调试(attachs/20060907_164540_564.rar system) 把所有task和系统core、中断看成一个整体,可用于调试系统和中断。对中断调试,如果不是系统级调试,无论是那种断点都不起作用 !wdbAgent不在调试范围内,当任务级调试时工作在中断方式,系统级调试工作在轮询方式。 !可是使用命令行方式的调试,参看crossWind教程。 4.调度 优先级调度(无条件) 时间片:同优先级,如果时间片没有打开,任务采取先到先运行,运行完毕在交出cpu,如果打开,则轮流使用cpu。 !死循环使比它...