跳至主要内容

【转】MMU概述

I. 什么是MMU,MMU的作用
MMU是Memory Management Unit的缩写. 针对各种CPU, MMU是个可选的配件. MMU负责的是虚拟地址 &O1663;&O1664; 物理地址的转换. 提供硬件机制的内存访问授权.
现 代的多用户多进程操作系统, 需要MMU, 才能达到每个用户进程都拥有自己的独立的地址空间的目标. 使用MMU, OS划分出一段地址区域, 在这块地址区域中, 每个进程看到的内容都不一定一样. 例如MICROSOFT WINDOWS操作系统, 地址4M-2G处划分为用户地址空间. 进程A在地址 0X400000映射了可执行文件. 进程B同样在地址 0X400000映射了可执行文件. 如果A进程读地址0X400000, 读到的是A的可执行文件映射到RAM的内容. 而进程B读取地址0X400000时则读到的是B的可执行文件映射到RAM的内容.
这就是MMU在当中进行地址转换所起的作用.
II. X86系列的MMU
INTEL出品的80386CPU或者更新的CPU中都集成有MMU. 可以提供32BIT共4G的地址空间.

III. ARM系列的MMU
    ARM出品的CPU, MMU作为一个协处理器存在. 根据不同的系列有不同搭配. 需要查询DATASHEET才可知道是否有MMU. 如果有的话, 一定是编号为15的协处理器. 可以提供32BIT共4G的地址空间.

IV X86启动MMU后的寻址模式
1.    X86 MMU提供的模式有4K/2M/4M的PAGE模式(根据不同的CPU, 提供不同的能力), 此处提供的是目前大部分OS使用的4K PAGE模式的描述. 并且不提供ACCESS CHECK的部分. (毕竟不是完整的CPU手册. &O1514;)
2.    涉及的寄存器
a)    GDT
b)    LDT
c)    CR0
d)    CR3
e)    SEGMENT REGISTER
3.    虚拟地址到物理地址的转换步骤(INTEL的2M/4M的PAGE或许会在将来文章中描述)
a)    SEGMENT REGISTER作为GDT或者LDT的INDEX, 取出对应的GDT/LDT ENTRY. 注 意: SEGMENT是无法取消的, 即使是FLAT模式下也是如此. 说FLAT模式下不使用SEGMENT REGISTER是错误的. 任意的RAM寻址指令中均有DEFAULT的SEGMENT假定. 除非使用SEGMENT OVERRIDE PREFIX来改变当前寻址指令的SEGMENT, 否则使用的就是DEFAULT SEGMENT.
i.    ENTRY格式
typedef struct
{
    UINT16    limit_0_15;
    UINT16    base_0_15;
    UINT8        base_16_23;

    UINT8        accessed    : 1;
    UINT8        readable    : 1;
    UINT8        conforming  : 1;
    UINT8        code_data   : 1;
    UINT8        app_system  : 1;
    UINT8        dpl         : 2;
    UINT8        present     : 1;

    UINT8        limit_16_19 : 4;
    UINT8        unused      : 1;
    UINT8        always_0    : 1;
    UINT8        seg_16_32   : 1;
    UINT8        granularity : 1;

    UINT8        base_24_31;
} CODE_SEG_DESCRIPTOR,*PCODE_SEG_DESCRIPTOR;

typedef struct
{
    UINT16    limit_0_15;
    UINT16    base_0_15;
    UINT8        base_16_23;

    UINT8        accessed    : 1;
    UINT8        writeable   : 1;
    UINT8        expanddown  : 1;
    UINT8        code_data   : 1;
    UINT8        app_system  : 1;
    UINT8        dpl         : 2;
    UINT8        present     : 1;

    UINT8        limit_16_19 : 4;
    UINT8        unused      : 1;
    UINT8        always_0    : 1;
    UINT8        seg_16_32   : 1;
    UINT8        granularity : 1;

    UINT8        base_24_31;
} DATA_SEG_DESCRIPTOR,*PDATA_SEG_DESCRIPTOR;

共 有4种ENTRY格式, 此处提供的是CODE SEGMENT和DATA SEGMENT的ENTRY格式. FLAT模式下的ENTRY在base_0_15, base_16_23处为0, 而limit_0_15, limit_16_19处为0xfffff.  granularity处为1. 表名SEGMENT地址空间是从0到0XFFFFFFFF的4G的地址空间.
b)    从SEGMENT处取出BASE ADDRESS 和LIMIT. 将要访问的ADDRESS首先进行ACCESS CHECK, 是否超出SEGMENT的限制.
c)    将要访问的ADDRESS+BASE ADDRESS, 形成需要32BIT访问的虚拟地址. 该地址被解释成如下格式:
typedef struct
{
    UINT32    offset        :12;
    UINT32    page_index    :10;
    UINT32    pdbr_index    :10;
} VA,*LPVA;
d)    pdbr_index作为CR3的INDEX, 获得到一个如下定义的数据结构
typedef struct
{
    UINT8    present        :1;
    UINT8    writable    :1;
    UINT8    supervisor    :1;
    UINT8    writethrough:1;
    UINT8    cachedisable:1;
    UINT8    accessed    :1;
    UINT8    reserved1    :1;
    UINT8    pagesize    :1;
   
    UINT8    ignoreed    :1;
    UINT8    avl            :3;
    UINT8    ptadr_12_15    :4;

    UINT16    ptadr_16_31;
}PDE,*LPPDE;
e)    从中取出PAGE TABLE的地址. 并且使用page_index作为INDEX, 得到如下数据结构
typedef struct
{
    UINT8    present        :1;
    UINT8    writable    :1;
    UINT8    supervisor    :1;
    UINT8    writethrough:1;
    UINT8    cachedisable:1;
    UINT8    accessed    :1;
    UINT8    dirty        :1;
    UINT8    pta            :1;
   
    UINT8    global        :1;
    UINT8    avl            :3;
    UINT8    ptadr_12_15    :4;

    UINT16    ptadr_16_31;
}PTE,*LPPTE;
f)    从PTE中获得PAGE的真正物理地址的BASE ADDRESS. 此BASE ADDRESS表名了物理地址的.高20位. 加上虚拟地址的offset就是物理地址所在了.

ARM启动MMU后的寻址模式
1.    ARM MMU提供的分页模式有1K/4K/64K 3种模式. 本文介绍的是目前OS通常使用的4K模式. 并且不提供ACCESS CHECK的部分. (毕竟不是完整的CPU手册. &O1514;)
2.    涉及的寄存器, 全部位于协处理器15. 
3.    ARM没有SEGMENT的寄存器, 是真正的FLAT模式的CPU. 给定一个ADDRESS. 该地址可以被理解为如下数据结构:
typedef struct
{
    UINT32    offset        :12;
    UINT32    page_index    :8;
    UINT32    pdbr_index    :12;
} VA,*LPVA;
4.    从MMU寄存器2中取出BIT14-31. pdbr_index就是这个表的索引. 每个入口为4BYTE大小. 结构为
typedef struct
{
    UINT32    type        :2;    //always set to 01b
    UINT32    writebackcacheable:1;
    UINT32    writethroughcacheable:1;
    UINT32    ignore    :1;    //set to 1b always
    UINT32    domain    :4;
    UINT32    reserved    :1;    //set 0
    UINT32    base_addr:22;
} PDE,*LPPDE;
5.    获得的PDE地址, 获得如下结构的ARRAY, 用page_index作为索引,取出内容.
typedef struct
{
    UINT32    type        :2;    //always set to 11b
    UINT32    ignore    :3;    //set to 100b always
    UINT32    domain    :4;
    UINT32    reserved    :3;    //set 0
    UINT32    base_addr:20;
} PTE,*LPPTE;
6.    从PTE中获得的基地址和上offset,组成了物理地址.
7.    PDE/PTE中其他的BIT, 用于访问控制. 这边讲述的是一切正常, 物理地址被正常组合出来的状况.

ARM/X86 MMU使用上的差异
1.    X86始终是有SEGMENT的概念存在. 而ARM则没有此概念(没有SEGMENT REGISTER.).
2.    ARM有个DOMAIN的概念. 用于访问授权. 这是X86所没有的概念. 当通用OS尝试同时适用于此2者的CPU上, 一般会抛弃DOMAIN的使用. 

评论

此博客中的热门博文

【转】AMBA、AHB、APB总线简介

AMBA 简介 随着深亚微米工艺技术日益成熟,集成电路芯片的规模越来越大。数字IC从基于时序驱动的设计方法,发展到基于IP复用的设计方法,并在SOC设计中得到了广泛应用。在基于IP复用的SoC设计中,片上总线设计是最关键的问题。为此,业界出现了很多片上总线标准。其中,由ARM公司推出的AMBA片上总线受到了广大IP开发商和SoC系统集成者的青睐,已成为一种流行的工业标准片上结构。AMBA规范主要包括了AHB(Advanced High performance Bus)系统总线和APB(Advanced Peripheral Bus)外围总线。   AMBA 片上总线        AMBA 2.0 规范包括四个部分:AHB、ASB、APB和Test Methodology。AHB的相互连接采用了传统的带有主模块和从模块的共享总线,接口与互连功能分离,这对芯片上模块之间的互连具有重要意义。AMBA已不仅是一种总线,更是一种带有接口模块的互连体系。下面将简要介绍比较重要的AHB和APB总线。 基于 AMBA 的片上系统        一个典型的基于AMBA总线的系统框图如图3所示。        大多数挂在总线上的模块(包括处理器)只是单一属性的功能模块:主模块或者从模块。主模块是向从模块发出读写操作的模块,如CPU,DSP等;从模块是接受命令并做出反应的模块,如片上的RAM,AHB/APB 桥等。另外,还有一些模块同时具有两种属性,例如直接存储器存取(DMA)在被编程时是从模块,但在系统读传输数据时必须是主模块。如果总线上存在多个主模块,就需要仲裁器来决定如何控制各种主模块对总线的访问。虽然仲裁规范是AMBA总线规范中的一部分,但具体使用的算法由RTL设计工程师决定,其中两个最常用的算法是固定优先级算法和循环制算法。AHB总线上最多可以有16个主模块和任意多个从模块,如果主模块数目大于16,则需再加一层结构(具体参阅ARM公司推出的Multi-layer AHB规范)。APB 桥既是APB总线上唯一的主模块,也是AHB系统总线上的从模块。其主要功能是锁存来自AHB系统总线的地址、数据和控制信号,并提供二级译码以产生APB外围设备的选择信号,从而实现AHB协议到APB协议的转换。 ====================================

【转】GPIO编程模拟I2C入门

ARM编程:ARM普通GPIO口线模拟I2C  请教个问题: 因为需要很多EEPROM进行点对点控制,所以我现在要用ARM的GPIO模拟I2C,管脚方向我设 置的是向外的。我用网上的RW24C08的万能程序修改了一下,先进行两根线的模拟,SDA6, SCL6,但是读出来的数不对。我做了一个简单的实验,模拟SDA6,SCL6输出方波,在示波 器上看到正确方波,也就是说,我的输出控制是没问题的。 哪位大哥能指点一下,是否在接收时管脚方向要设为向内?(不过IOPIN不管什么方向都可 以读出当前状态值的阿) 附修改的RW24C08()程序: #define  SomeNOP() delay(300); /**/ /* *********************************  RW24C08   **************************************** */ /**/ /* ----------------------------------------------------------------------------- ---  调用方式:void I2CInit(void)   函数说明:私有函数,I2C专用 ------------------------------------------------------------------------------- -- */ void  I2CInit( void ) ... {  IO0CLR  =  SCL6;      // 初始状态关闭总线  SomeNOP();  // 延时   I2CStop();  // 确保初始化,此时数据线是高电平 }   /**/ /* ---------------------------------------------------------------------------- ----  调用方式:void I2CStart(void)   函数说明:私有函数,I2C专用 ------------------------------------------------------------------------------- -- */ void  I2CStart( void )

【转】cs8900网卡的移植至基于linux2.6内核的s3c2410平台

cs8900网卡的移植至基于linux2.6内核的s3c2410平台(转) 2008-03-11 20:58 硬件环境:SBC-2410X开发板(CPU:S3C2410X) 内核版本:2.6.11.1 运行环境:Debian2.6.8 交叉编译环境:gcc-3.3.4-glibc-2.3.3 第一部分 网卡CS8900A驱动程序的移植 一、从网上将Linux内核源代码下载到本机上,并将其解压: #tar jxf linux-2.6.11.1.tar.bz2 二、打开内核顶层目录中的Makefile文件,这个文件中需要修改的内容包括以下两个方面。 (1)指定目标平台。 移植前:         ARCH?= $(SUBARCH) 移植后: ARCH            :=arm (2)指定交叉编译器。 移植前: CROSS_COMPILE ?= 移植后: CROSS_COMPILE   :=/opt/crosstool/arm-s3c2410-linux-gnu/gcc-3.3.4-glibc-2.3.3/bin/arm-s3c2410-linux-gnu- 注:这里假设编译器就放在本机的那个目录下。 三、添加驱动程序源代码,这涉及到以下几个方面。(1)、从网上下载了cs8900.c和cs8900.h两个针对2.6.7的内核的驱动程序源代码,将其放在drivers/net/arm/目录下面。 #cp cs8900.c ./drivers/net/arm/ #cp cs8900.h ./drivers/net/arm/ 并在cs8900_probe()函数中,memset (&priv,0,sizeof (cs8900_t));函数之后添加如下两条语句: __raw_writel(0x2211d110,S3C2410_BWSCON); __raw_writel(0x1f7c,S3C2410_BANKCON3); 注:其原因在"第二部分"解释。 (2)、修改drivers/net/arm/目录下的Kconfig文件,在最后添加如下内容: Config ARM_CS8900    tristate "CS8900 support" depends on NET_ETHERNET && A