深入剖析Linux RCU原理(一)初窥门径
说明:
Kernel版本:4.14
ARM64处理器,Contex-A53,双核
使用工具:Source Insight 3.5, Visio
1. 概述
RCU, Read-Copy-Update
,是Linux内核中的一种同步机制。RCU
常被描述为读写锁的替代品,它的特点是读者并不需要直接与写者进行同步,读者与写者也能并发的执行。RCU
的目标就是最大程度来减少读者侧的开销,因此也常用于对读者性能要求高的场景。
优点:
读者侧开销很少、不需要获取任何锁,不需要执行原子指令或者内存屏障;
没有死锁问题;
没有优先级反转的问题;
没有内存泄露的危险问题;
很好的实时延迟;
缺点:
写者的同步开销比较大,写者之间需要互斥处理;
使用上比其他同步机制复杂;
来一张图片来描述下大体的操作吧:

多个读者可以并发访问临界资源,同时使用
rcu_read_lock/rcu_read_unlock
来标定临界区;写者(
updater
)在更新临界资源的时候,拷贝一份副本作为基础进行修改,当所有读者离开临界区后,把指向旧临界资源的指针指向更新后的副本,并对旧资源进行回收处理;图中只显示一个写者,当存在多个写者的时候,需要在写者之间进行互斥处理;
上述的描述比较简单,RCU的实现很复杂。本文先对RCU来一个初印象,并结合接口进行实例分析,后续文章再逐层深入到背后的实现原理。开始吧!
2. RCU基础
2.1 RCU基本要素
RCU
的基本思想是将更新Update
操作分为两个部分:1)Removal
移除;2)Reclamation
回收。直白点来理解就是,临界资源被多个读者读取,写者在拷贝副本修改后进行更新时,第一步需要先把旧的临界资源数据移除(修改指针指向),第二步需要把旧的数据进行回收(比如kfree
)。
因此,从功能上分为以下三个基本的要素:Reader/Updater/Reclaimer
,三者之间的交互如下图:

Reader
使用
rcu_read_lock
和rcu_read_unlock
来界定读者的临界区,访问受RCU
保护的数据时,需要始终在该临界区域内访问;在访问受保护的数据之前,需要使用
rcu_dereference
来获取RCU-protected
指针;当使用不可抢占的
RCU
时,rcu_read_lock/rcu_read_unlock
之间不能使用可以睡眠的代码;Updater
多个Updater更新数据时,需要使用互斥机制进行保护;
Updater使用
rcu_assign_pointer
来移除旧的指针指向,指向更新后的临界资源;Updater使用
synchronize_rcu
或call_rcu
来启动Reclaimer
,对旧的临界资源进行回收,其中synchronize_rcu
表示同步等待回收,call_rcu
表示异步回收;Reclaimer
Reclaimer回收的是旧的临界资源;
为了确保没有读者正在访问要回收的临界资源,Reclaimer需要等待所有的读者退出临界区,这个等待的时间叫做宽限期(
Grace Period
);
【文章福利】小编推荐自己的Linux内核技术交流群:【749907784】整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面,有需要的可以自行添加哦!!!(含视频教程、电子书、实战项目及代码)


2.2 RCU三个基本机制
用来提供上述描述的功能,RCU
基于三种机制来实现。
2.2.1 Publish-Subscribe Mechanism
订阅机制是个什么概念,来张图:

Updater
与Reader
类似于Publisher
和Subsriber
的关系;Updater
更新内容后调用接口进行发布,Reader
调用接口读取发布内容;
那么这种订阅机制,需要做点什么来保证呢?来看一段伪代码:
乍一看似乎问题不大,Updater进行赋值更新,Reader进行读取和其他处理。然而,由于存在编译乱序和执行乱序的问题,上述代码的执行顺序不见得就是代码的顺序,比如在某些架构(DEC Alpha
)中,读者的操作部分,可能在p赋值之前就操作了do_something_with()
。
为了解决这个问题,Linux提供了rcu_assign_pointer/rcu_dereference
宏来确保执行顺序,Linux内核也基于rcu_assign_pointer/rcu_dereference
宏进行了更高层的封装,比如list
, hlist
,因此,在内核中有三种被RCU保护的场景:1)指针;2)list链表;3)hlist哈希链表。
针对这三种场景,Publish-Subscribe
接口如下表:

2.2.2 Wait For Pre-Existing RCU Readers to Complete
Reclaimer需要对旧的临界资源进行回收,那么问题来了,什么时候进行呢?因此RCU
需要提供一种机制来确保之前的RCU读者全部都已经完成,也就是退出了rcu_read_lock/rcu_read_unlock
标定的临界区后,才能进行回收处理。

图中Readers和Updater并发执行;
当Updater执行
Removal
操作后,调用synchronize_rcu
,标志着更新结束并开始进入回收阶段;在
synchronize_rcu
调用后,此时可能还有新的读者来读取临界资源(更新后的内容),但是,Grace Period
只等待Pre-Existing
的读者,也就是在图中的Reader-4, Reader-5
。只要这些之前就存在的RCU读者退出临界区后,意味着宽限期的结束,因此就进行回收处理工作了;synchronize_rcu
并不是在最后一个Pre-Existing
RCU读者离开临界区后立马就返回,它可能存在一个调度延迟;
2.2.3 Maintain Multiple Versions of Recently Updated Objects
从2.2.2节
可以看出,在Updater进行更新后,在Reclaimer进行回收之前,是会存在新旧两个版本的临界资源的,只有在synchronize_rcu
返回后,Reclaimer对旧的临界资源进行回收,最后剩下一个版本。显然,在有多个Updater时,临界资源的版本会更多。
还是来张图吧,分别以指针和链表为例:

调用
synchronize_rcu
开始为临界点,分别维护不同版本的临界资源;等到Reclaimer回收旧版本资源后,最终归一统;
3. RCU示例分析
是时候来一波fucking sample code
了。
整体的代码逻辑:
构造四个内核线程,两个内核线程测试指针的RCU保护操作,两个内核线程用于测试链表的RCU保护操作;
在回收的时候,分别用了
synchronize_rcu
同步回收和call_rcu
异步回收两种机制;为了简化代码,基本的容错判断都已经省略了;
没有考虑多个Updater的机制,因此,也省略掉了Updater之间的互斥操作;
为了证明没有骗人,贴出在开发板上运行的输出log,如下图:

4. API介绍
4.1 核心API
下边的这些接口,不能更核心了。
4.2 其他相关API
基于核心的API,扩展了其他相关的API,如下,不再详述:
好吧,罗列这些API有点然并卵。
原文作者:LoyenWang
