王道操作系统第3章-内存管理-内存管理基础
第3章-内存管理-内存管理基础
内存的基础知识
绝对装入
静态重定位
动态重定位
装入的三种方式
从写程序到程序运行
内存管理的概念
内存保护
覆盖与交换
覆盖技术
交换技术
连续分配管理方式
单一连续分配
固定分区分配
动态分区分配
动态分区分配算法
首次适应算法
最佳适应算法
最坏适应算法
临近适应算法
基本分页存储管理的概念
分页存储
页表
实现地址的转换
基本地址变换机构
具有快表的地址变换机构
快表TLB
局部性原理
两级页表
解决问题一
解决问题二
采用多级列表需要注意的问题
基本分段存储管理方式
段表
分段、分页管理的对比
段页式管理方式
段页式管理的逻辑地址结构











内存的基础知识
如何把指令中的逻辑地址转换为物理地址?
绝对装入
可重定位装入(静态重定位)
动态运行时装入(动态重定位)
装入的三种方式
绝对装入
在编译时,如果知道程序将放到内存中的哪个位置,编译程序将产生绝对地址的目标代码。装入程序按照装入模块中的地址,将程序和数据装入内存。
绝对装入只适用于单道程序环境,也就是早期的没有操作系统的阶段
静态重定位
又称可重定位装入。编译、链接后的装入模块的地址都是从0开始的,指令中使用的地址、数据存放的地址都是相对于起始地址而言的逻辑地址。可根据内存的当前情况,将装入模块装入到内存的适当位置。装入时对地址进行“重定位”,将逻辑地址变换为物理地址(地址变换是在装入时一次完成的)
静态重定位的特点是在一个作业装入内存时,必须分配其要求的全部内存空间,如果没有足够的内存,就不能装入该作业。作业一旦进入内存后,在运行期间就不能再移动,也不能再申请内存空间
动态重定位
又称动态运行时装入。编译、链接后的装入模块的地址都是从0开始的。装入程序把装入模块装入内存后,并不会立即把逻辑地址转化为物理地址,而是把地址转换推迟到程序真正要执行时才进行。因此装入内存后所有的地址依然是逻辑地址。这种方式需要一个重定位寄存器的支持
现代操作系统往往采用这种方式,优点:
采用动态重定位时允许程序在内存中发生移动,并且可以将程序分配到不连续地存储区中
在程序运行前只需装入它的部分代码即可投入运行,然后在程序运行期间,根据动态申请分配内存
便于程序段的共享,可以向用户提供一个比存储空间大得多的地址空间
从写程序到程序运行
编译:由编译程序将用户源代码编译成若干个目标模块(编译就是把高级语言翻译为机器语言)
链接:由链接程序将编译后形成的一组目标模块,以及所需库函数链接在一起,形成一个完整的装入模块
装入(装载):由装入程序将装入模块装入内存运行
其中,链接由三种方式
静态链接:在程序运行之前,先将各目标模块及它们所需的库函数连接成一个完整的可执行文件(装入模块),之后不再拆开
装入时动态链接:将各目标模块装入内存时,边装入边链接的链接方式
运行时动态链接:在程序执行中需要该目标模块时,才对它进行链接,用不到的模块不需要装入内存。其优点是便于修改和更新,便于实现对目标模块的共享。
内存管理的概念
操作系统需要对内存管些什么呢?
操作系统负责内存空间的分配与回收
操作系统需要提供某种技术从逻辑上对内存空间进行扩充
操作系统需要提供地址转换功能,负责程序的逻辑地址与物理地址的转换
操作系统需要提供内存保护功能,保证各进程在各自存储空间内运行,互不干扰
内存保护
内存保护可采取两种方法
方法1:在CPU中设置一对上、下限寄存器,存放进程的上、下限地址。进程的指令要访问某个地址时,CPU检查是否越界
方法2:采用重定位寄存器(又称基址寄存器)和界地址寄存器(又称限长寄存器)进行越界检查。重定位寄存器中存放的是进程的起始物理地址。界地址寄存器中存放的是进程的最大逻辑地址
覆盖与交换
覆盖技术
早期的计算机内存很小,比如IBM推出的第一台PC机最大只支持1MB大小的内存,因此常常会出现内存大小不够的情况
后来人们引入了覆盖技术,用来解决“程序大小超过物理内存总和”的问题
覆盖技术的思想:将程序分为多个段(多个模块),常用的段常驻内存,不常用的段在需要时调入内存。内存中分为一个“固定区”和若干个“覆盖区”需要常驻内存的段放在“固定区”中,调入后就不再调出(除非运行结束)不常用的段放在“覆盖区”,需要用到时调入内存,用不到时调出内存
必须由程序员声明覆盖结构,操作系统完成自动覆盖。
缺点:对用户不透明,增加了用户编程负担
覆盖系统只用于早期的操作系统中,现在已退出历史舞台
交换技术
设计思想:内存空间紧张时,系统将内存中某些进程暂时换出外存,把外存中某些已具备运行条件的进程换入内存(进程在内存与磁盘间动态调度)
进程的PCB是需要常驻内存的,无论是否调出
中级调度(内存调度),就是决定将哪个处于挂起状态的进程重新调入内存
应该在外存(磁盘)的什么位置保存被换出的进程?具有对换功能的操作系统中,通常把磁盘空间分为文件区和对换区两部分。文件区主要用于存放文件,主要追求存储空间的利用率,因此对文件区空间的管理采用离散分配方式;对换区空间只占磁盘空间的小部分,被换出的进程数据就存放在对换区。由于对换的速度直接影响到系统的整体速度,因此对换区空间的管理主要追求换入换出速度,因此通常对换区采用连续分配方式。总之,对换区的IO速度比文件区的更快
什么时候应该交换?交换通常在许多进程运行且内存吃紧时进程,而系统负荷降低就暂停。例如:在发现许多进程运行时经常发生缺页,就说明内存紧张,此时可以换出一些进程;如果缺页率明显下降,就可以暂停换出
应该换出哪些进程?可以换出阻塞进程、优先级低的进程。为了防止优先级低的进程在被调入内存后很快又被换出,有的系统还会考虑进程在内存的驻留时间(注意:PCB会常驻内存,不会被换出外存)
连续分配管理方式
连续分配:指为用户进程分配的必须是一个连续的内存空间
内部碎片:分配给某进程的内存区域中,有些部分没有用上
外部碎片:指内存中的某些分区由于太小而难以利用
单一连续分配
在单一连续分配方式中,内存被分为系统区和用户区。系统区通常位于内存的低地址部分,用于存放操作系统相关数据;用户区用于存放用户进程相关数据。
内存中只能由一道用户程序,用户程序独占整个用户区空间
优点:实现简单;无外部碎片;可以采用覆盖技术扩充内存;不一定需要采取内存保护(如早期的PC操作系统MS-DOS)
缺点:只能用于单用户、单任务的操作系统中;有内部碎片(分配给某进程的内存区域中,如果有些部分没有用上,就是“内部碎片”);存储器利用率极低
固定分区分配
20世纪60年代出现了支持多道程序的系统,为了能在内存中装入多道程序,且这些程序之间又不会互相干扰,于是将整个用户空间划分为若干个固定大小的分区,每个分区中只装入一道作业,这样就形成了最早的、最简单的一种可运行多道程序的内存管理方式
固定分区分配:
分区大小相等缺乏灵活性,但是很适用于一台计算机控制多个相同对象的场合(比如:炼钢厂有n个相同的炼钢炉,就可以把内存分为n个大小相等的区域存放n个炼钢炉控制程序)
分区大小不等增加了灵活性,可以满足大小不同的进程需求。根据常在系统中运行的作业大小情况进行划分(比如:划分多个小分区、适量中等分区)
操作系统需要建立一个数据结构——分区说明表,来实现各个分区的分配与回收。每个表项对应一个分区,通常按分区大小排列。每个表项包括对应分区的大小、起始地址、状态(是否已分配)
当某应用程序要装入内存时,由操作系统内核程序根据用户程序大小检索该表,从中找到一个能满足大小的、未分配的分区,将之分配给该程序,然后修改状态为“已分配”
优点:实现简单,无外部碎片
缺点:
当用户程序太大时,可能所有的分区都不能满足需求,此时不得不采用覆盖技术来解决,但这又会降低性能
会产生内部碎片,内存利用率低(比如一个应用程序需要10MB但是只有12MB的分区6可供使用)
动态分区分配
动态分区分配又称为可变分区分配,这种分配方式不会预先划分内存区域,而是在进程装入内存时,根据进程的大小动态地建立分区,并使分区的大小正好适合进程的需要。因此系统分区的大小和数目是可变的
系统要用什么样的数据结构记录内存的使用情况?两种常用的数据结构:空闲分区表、空闲分区链
空闲分区表:每个空闲分区对应一个表项,表项中包含分区号、分区大小、分区起始地址等信息
空闲分区链:每个分区的起始部分和末尾部分分别设置前项指针和后向指针。起始部分还可记录分区大小等信息
当有很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?把一个新作业装入内存时,需按照一定的动态分区分配算法,从空闲分区表(或空闲分区链)中选出一个分区分配给该作业。由于分配算法对系统性能有很大的影响,因此人们做了广泛研究。下一节会介绍四种动态分区分配算法
如何进行分区的分配与回收操作?
分配时可能遇到的两种情况如果进程5需要4MB空间,将其分配给分区大小为20MB的空闲分区1号,重新修改空闲分区表的分区大小与起始地址
如果进程5需要4MB空间,将其分配给分区大小刚好为4MB的空闲分区三号,在空闲分区表中删除3号分区对应的表项
回收时可能遇到的情况
进程4的4MB空间需要回收,且与某个空闲分区相邻,将这两块空间合并为1个如果与前后的空闲分区都相邻,则将三块空间合并为1个
如果前后都没有相邻的空闲分区,则新增一个表项
动态分区分配没有内部碎片,但是有外部碎片
如果内存中的空闲区间总和本来可以满足某进程的需求,但由于进程需要的是一块连续的内存空间,因此这些“碎片”不能满足进程的需求,可以通过紧凑(拼凑)技术来解决外部碎片
动态分区分配算法
动态分区分配算法:在动态分区分配方式中,当很多个空闲分区都能满足需求时,应该选择哪个分区进行分配?
首次适应算法
算法思想:每次都从低地址开始查找,找到第一个能满足大小的空闲分区
如何实现:空闲分区以地址递增的次序排列,每次分配内存时顺序查找空闲分区链(或空闲分区表),找到大小能满足要求的第一个空闲分区。分配完后重新修改空闲分区链。
最佳适应算法
算法思想:由于动态分区分配是一种连续分配方式,为各进程分配的空间必须是连续的一整片区域,因此为了保证当“大进程”到来时能有连续的大片空间,可以尽可能多地留下大片的空闲区,即优先使用更小的空闲区
如何实现:空闲分区按容量递增次序链接,每次分配内存时顺序查找空闲分区链(表),找到大小能满足要求的第一个空闲分区
缺点:每次都选最小的分区进行分配,会留下越来越多的、很小的、难以利用的内存块,因此这种方法会产生很多的外部碎片
最坏适应算法
又称最大适应算法(Largest Fit)。
算法思想:为了解决最佳适应算法的问题——即留下太多难以利用的小碎片,可以在每次分配时优先使用最大的连续空闲区,这样分配后剩余的空闲区就不会太小,更方便使用。
如何实现:空闲分区按容量递减次序链接,每次分配内存时顺序查找空闲分区链(表),找到大小能满足要求的第一个空闲分区
缺点:每次都选最大的分区进行分配,虽然可以让分配后留下的空闲区更大,更可用,但是这种方式会导致较大的连续空闲区被迅速用完,如果之后有“大进程”到达,就没有内存分区可用了。
临近适应算法
算法思想:首次适应算法每次都是从链头开始查找的,这可能导致低地址部分出现很多的空闲分区,而每次分配查找时,都经过这些分区,因此也增加了查找的开销。如果每次都从上次查找结束的位置开始检索,就能解决上述问题
如何实现:空闲分区以地址递增的顺序排列(可排成一个循环链表)。每次分配内存时从上次查找结束的位置开始查找空闲分区链(表),找到大小满足要求的第1个空闲分区
首次适应算法每次都要从头开始查找,每次都要检索低地址的小分区,但是这种规则也决定了当低地址部分有更小的分区可以满足要求时,会更有可能用到低地址部分的小分区,也会更有可能把高地址部分的大分区保留下来(最佳适应算法的优点)
临近适应算法的规则可能会导致无论低地址、高地址部分的空闲分区都有相同的概率被使用,也就导致了高地址部分的大分区更可能被使用,划分为小分区,最后导致无大分区可用(最大适应算法的缺点)
综合来看,四种算法中,首次适应算法的效果反而更好
基本分页存储管理的概念
非连续分配:为用户进程分配的可以是一些分散的内存空间
分页存储
将内存空间分为一个个大小相等的分区(比如:每个分区4KB),每个分区就是一个“页框”(页框=页帧=内存块=物理块=物理页面)。每个页框有一个编号,即“页框号”(页框号=页帧号=内存块号=物理块号=物理页号),页框号从0开始
将进程的逻辑地址空间也分为与页框大小相等的一个个部分,每个部分称为一个“页”或“页面”。每个页面有一个编号,即“页号”,页号也是从0开始
注意:页不等于页框
操作系统以页框为单位为各个进程分配内存空间。进程的每个页面分别放入一个页框中。也就是说,进程的页面与内存的页框有一一对应的关系
各个页面不必连续存放,可以放到不相邻的各个页框中
页表
为了能知道进程的每个页面在内存中存放的位置,操作系统为每个进程建立一张页表
页表通常存在于PCB(进程控制块)中
每个进程对应一张页表
进程的每个页面对应一个页表项
每个页表项由“页号”和“块号”组成
页表记录进程页面实际存放的内存块之间的映射关系
页表项连续存放,因此页号可以是隐含的,不占存储空间(类比数组)
实现地址的转换
将进程地址空间分页后,操作系统该如何实现逻辑地址到物理地址的转换?
特点:虽然进程的各个页面是离散存放的,但是页面内部是连续存放的
如果要访问逻辑地址A,则
确定逻辑地址A对应的“页号”P
找到P号页面在内存中的起始地址(需要查页表)
确定逻辑地址A的“页面偏移量”W
逻辑地址A对应的物理地址=P号页面在内存中的起始地址+页面偏移量W
基本地址变换机构
基本地址变换机构可以借助进程的页表将逻辑地址转换为物理地址
通常会在系统中设置一个页表寄存器(PTR),存放页表在内存中的起始地址F和页表长度M。进程未执行时,页表的起始地址和页表长度放在进程控制块PCB中,当进程被调度时,操作系统内核会把它们放到页表寄存器中
注意:页面大小是2的整数幂设页面大小为L,将逻辑地址A到物理地址E的变换过程如下:
计算页号P和页内偏移量W(如果用十进制数手算,则P=A/L,W=A%L;但是在计算机实际运行时,逻辑地址结构是固定不变的,因此计算机硬件可以更快地得到二进制表示的页号、页内偏移量)
比较页号P和页表长度M,若P\geM,则产生越界中断,否则继续执行。(注意:页号是从0开始的,而页表长度至少是1,因此P=M时也会越界)
页表中页号P对应的页表项地址=页表起始地址F+页号P*页表项长度。取出该页表项内容b,即为内存块号。(注意区分页表项长度、页表长度、页面大小的区别。页表长度指的是这个页表中总共有几个页表项,即总共有几个页;页表项长度指的是每个页表项占多大的存储空间;页面大小指的是一个页面占多大的存储空间)
计算E=b*L+W,用得到的物理地址E去访存。(如果内存块号、页面偏移量是用二进制表示的,那么把二者拼接起来就是最终的物理地址了)
为了方便页表的查询,常常会让一个页表项占2的整数次幂个字节,使每个页面恰好可以装得下整数个页表项
具有快表的地址变换机构
快表TLB
快表,又称联想寄存器(TLB,translation lookaside buffer),是一种访问速度比内存快很多的高速缓存(TLB不是内存!),用来存放最近访问的页表项的副本,可以加速地址变换的速度。与之对应,内存中的页表常称为慢表
引入快表后地址的变换过程:
CPU给出逻辑地址,由某个硬件算得页号、页内偏移量,将页号与快表中的所有页号进行比较
如果找到匹配的页号,说明要访问的页表项在快表中有副本,则直接从中取出该页对应的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后访问该物理地址对应的内存单元。因此,若快表命中,则访问某个逻辑地址仅需一次访存即可
如果没有找到匹配的页号,则需要访问内存中的页表,找到对应页的表项,得到页面存放的内存块号,再将内存块号与页内偏移量拼接形成物理地址,最后访问该物理地址对应的内存单元。因此,若快表未命中,则访问某个逻辑地址需要两次访存(注意:在找到页表项后,应同时将其存入快表,以便后面可能得再次访问。但若快表已满,则必须按照一定的算法对旧的页表项进行替换)
由于查询快表的速度比查询页表的速率快很多,因此只要快表命中,就可以节省很多时间。
局部性原理
时间局部性:如果执行了程序中的某条指令,那么不久后这条指令就很可能再次执行;如果某条数据被访问过,不久后该数据很可能再次被访问(因为程序中存在大量的循环)
空间局部性:一旦程序访问了某个内存单元,在不久之后,其附近的存储单元也很有可能被访问(因为很多数据在内存中都是连续存放的)
两级页表
单级页表存在的两个问题
页表必须连续存放,因此当页表很大时,需要占用很多个连续的页框
没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问其中几个特定的页面
思考:我们是如何解决进程在内存中必须连续存储的问题的?
将进程地址空间分页,并为其建立一张页表,记录各页面的存放位置
同样的思路也可用于解决“页表必须连续存放”的问题,把必须连续存放的页表再分页
解决问题一
为了解决问题一:可将长长的页表进行分组,使每个内存块刚好可以放入一个分组(比如上个例子中,页面大小4KB,每个页表项4B,每个页面可存放1K个页表项,因此将每1K个连续的页表项为一组,每组刚好占一个内存块,再将各组离散地放到各个内存块中)
另外,要为离散分配的页表再建立一张页表,成为页目录表,或称外层页表、顶层页表
按照地址结构将逻辑地址拆分为三个部分
从PCB中读取页目录表的地址,再根据一级页号查页目录表,找到下一级页表再内存中的存放位置
根据二级页号查表,找到最终想访问的内存块号
结合页内偏移量得到物理地址
解决问题二
问题2:没有必要让整个页表常驻内存,因为进程在一段时间内可能只需要访问其中几个特定的页面
可以在需要访问页面时才把页面调入内存(虚拟存储技术),可以在页表项中增加一个标志位,用于表示该页面是否已经调入内存
若想访问的页面不在内存中,则产生缺页中断(内中断),然后将目标页面从外存调入内存
采用多级列表需要注意的问题
各级页表的大小不能超过一个页面
两级页表需要3次访存,n级列表需要n+1次访存
基本分段存储管理方式
进程的地址空间:按照程序自身地逻辑关系划分为若干个段,每个段都有一个段名(在低级语言中,程序使用段名来编程),每段从0开始编址
段表
问题:程序分为多个段,各个段离散地装入内存,为了保证程序能正常运行,就必须能从物理内存中找到各个逻辑段的存放位置。为此,需要为每个进程建立一张段映射表,简称“段表”
每个段对应一个段表项,其中记录了该段在内存中的起始位置(基址)和段的长度
各个段表项的长度是相同的。
分段、分页管理的对比
页是信息的物理单位。分页的主要目的是为了实现离散分配,提高内存利用率。分页仅仅是系统管理上的需要,完全是系统行为,对用户是不可见的
段时信息的逻辑单位。分段的主要目的是更好地满足用户需求。一个段通常包含着一组属于一个逻辑模块的信息。分段对用户是可见的,用户编程时需要显式地给出段名
页的大小固定且由系统决定。段的长度却不固定,取决于用户编写的程序
分页的用户进程地址空间是一维的,程序员只需给出一个记忆符即可表示一个地址。分段的用户进程地址空间是二维的,程序员在标识一个地址时,既要给出段名,也要给出段内地址
分段比分页更容易实现信息的共享和保护
访问一个逻辑地址需要几次访存?
分页(单级页表):第一次访存:查内存中的页表;第二次访存:访问目标内内存单元。总共两次
分段:第一次访存:查内存中的段表;第二次访存:访问目标内存单元。总共两次
与分页系统类似,分段系统也可以引入快表几个,将近期访问过的段表项放到快表中,这样可以减少一次访问
段页式管理方式
分页、分段的优缺点分析:
分页管理:
优点:内存利用率高,不会产生外部碎片,只有少量的页内碎片
缺点:不方便按照逻辑模块实现信息的共享和保护
分段管理
优点:很方便按照逻辑模块实现信息的共享和保护
如果段长过大,为其分配很大的连续空间会很不方便。另外,段式管理会产生外部碎片
段页式管理的逻辑地址结构
段号的位数决定了每个进程最多可以分为几个段页号位数决定了每个段最大有多少页页内偏移量决定了页面大小、内存块大小是多少
分段对用户是可见的,程序员编程时需要显式地给出段号、段内地址。而将各段分页对用户是不可见的,系统会根据段内地址自动地划分页号和页内偏移量。
因此段页式管理的地址结构是二维的
一个进程对应一个段表,但是每个段会对应一个页表,因此一个进程可能对应多个页表
往期文章:
王道操作系统第2章-进程管理-死锁 - 哔哩哔哩 (bilibili.com)
王道操作系统第2章-进程管理-进程的同步与互斥 - 哔哩哔哩 (bilibili.com)
王道操作系统第2章-进程管理-调度 - 哔哩哔哩 (bilibili.com)
王道操作系统第2章-进程管理-进程与线程 - 哔哩哔哩 (bilibili.com)
王道操作系统第1章-操作系统概述 - 哔哩哔哩 (bilibili.com)
