深入剖析Linux文件系统之文件系统挂载(一)(超详细~)
1.前言
环境:处理器架构:arm64内核源码:linux-5.11ubuntu版本:20.04.1代码阅读工具:vim+ctags+cscope
我们知道,Linux系统中我们经常将一个块设备上的文件系统挂载到某个目录下才能访问这个文件系统下的文件,但是你有没有思考过:为什么块设备挂载之后才能访问文件?挂载文件系统Linux内核到底为我们做了哪些事情?是否可以不将文件系统挂载到具体的目录下也能访问?下面,本文将详细讲解Linxu系统中,文件系统挂载的奥秘。 注:本文主要讲解文件系统挂载核心逻辑,暂不涉及挂载命名空间和绑定挂载等内容(后面的内容可能会涉及),且以ext2磁盘文件系统为例讲解挂载。本专题文章分为上下两篇,上篇主要介绍挂载全貌以及具体文件系统的挂载方法,下篇介绍如何通过挂载实例关联挂载点和超级块。
2. vfs 几个重要对象
在这里我们不介绍整个IO栈,只说明和文件系统相关的vfs和具体文件系统层。我们知道在Linux中通过虚拟文件系统层VFS统一所有具体的文件系统,提取所有具体文件系统的共性,屏蔽具体文件系统的差异。VFS既是向下的接口(所有文件系统都必须实现该接口),同时也是向上的接口(用户进程通过系统调用最终能够访问文件系统功能)。 下面我们来看下,vfs中几个比较重要的结构体对象:
2.1 file_system_type
这个结构来描述一种文件系统类型,一般具体文件系统会定义这个结构,然后注册到系统中;定义了具体文件系统的挂载和卸载方法,文件系统挂载时调用其挂载方法构建超级块、跟dentry等实例。
文件系统分为以下几种:
1)磁盘文件系统
文件在非易失性存储介质上(如硬盘,flash),掉电文件不丢失。 如ext2,ext4,xfs
2)内存文件系统
文件在内存上,掉电丢失。
如tmpfs
3)伪文件系统
是假的文件系统,是利用虚拟文件系统的接口(可以对用户可见如proc、sysfs,也可以对用户不可见内核可见如sockfs,bdev)。
如proc,sysfs,sockfs,bdev
4)网络文件系统
这种文件系统允许访问另一台计算机上的数据,该计算机通过网络连接到本地计算机。
如nfs文件系统
结构体定义源码路径:include/linux/fs.h +2226
2.2 super_block
超级块,用于描述块设备上的一个文件系统总体信息(如文件块大小,最大文件大小,文件系统魔数等),一个块设备上的文件系统可以被挂载多次,但是内存中只能有个super_block来描述(至少对于磁盘文件系统来说)。
结构体定义源码路径:include/linux/fs.h +1414
【文章福利】小编推荐自己的Linux内核技术交流群:【891587639】整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面,有需要的可以自行添加哦!!!(含视频教程、电子书、实战项目及代码)


2.3 mount
挂载描述符,用于建立超级块和挂载点等之间的联系,描述文件系统的一次挂载,一个块设备上的文件系统可以被挂载多次,每次挂载内存中有一个mount对象描述。
结构体定义源码路径:fs/mount.h +39
2.4 inode
索引节点对象,描述磁盘上的一个文件元数据(文件属性、位置等),有些文件系统需要从块设备上读取磁盘上的索引节点,然后在内存中创建vfs的索引节点对象,一般在文件第一次打开时创建。
结构体定义源码路径:include/linux/fs.h +610
2.5 dentry
目录项对象,用于描述文件的层次结构,从而构建文件系统的目录树,文件系统将目录当作文件,目录的数据由目录项组成,而每个目录项存储一个目录或文件的名称和索引节点号等内容。每当进程访问一个目录项就会在内存中创建目录项对象(如ext2路径名查找中,通过查找父目录数据块的目录项,找到对应文件/目录的名称,获得inode号来找到对应inode)。
结构体定义源码路径:include/linux/dcache.h +90
2.6 file
文件对象,描述进程打开的文件,当进程打开文件时会创建文件对象加入到进程的文件打开表,通过文件描述符来索引文件对象,后面读写等操作都通过文件描述符进行(一个文件可以被多个进程打开,会由多个文件对象加入到各个进程的文件打开表,但是inode只有一个)。
结构体定义源码路径:include/linux/fs.h +915
3. 挂载总体流程
3.1系统调用处理
用户执行挂载是通过系统调用路径进入内核处理,拷贝用户空间传递参数到内核,挂载委托do_mount。 //fs/namespace.c SYSCALL_DEFINE5(mount
参数:
3.2 挂载点路径查找
3.3 参数合法性检查
参数合法性检查, 新挂载委托do_new_mount path_mount -> 参数合法性检查 -> 根据挂载标志调用不同函数处理 这里讲解是默认 do_new_mount
3.4 调用具体文件系统挂载方法
来看下文件系统类型没有实现init_fs_context接口的情况:
继续往下走:
3.5 挂载实例添加到全局文件系统树
下面主要看下vfs_get_tree和do_new_mount_fc:
4.具体文件系统挂载方法
来看下ext2对挂载的处理:
启动阶段初始化->
挂载时调用->
ext2_mount通过调用mount_bdev来执行实际文件系统的挂载工作,ext2_fill_super的一个函数指针作为参数传递给get_sb_bdev。该函数用于填充一个超级块对象,如果内存中没有适当的超级块对象,数据就必须从硬盘读取。
mount_bdev是个公用的函数,一般磁盘文件系统会使用它来根据具体文件系统的fill_super方法来读取磁盘上的超级块并在创建内存超级块。
我们来看下mount_bdev的实现(**它执行完成之后会创建vfs的三大数据结构 super_block、根inode和根dentry **):
2)mount_bdev源码分析
可以看到mount_bdev主要是:
1.根据要挂载的块设备文件名查找到对应的块设备描述符(内核后面操作块设备都是使用块设备描述符);
2.首先在文件系统类型的fs_supers链表查找是否已经读取过指定的vfs超级块,会对比每个超级块的s_bdev块设备描述符,没有创建一个vfs超级块;
3.新创建的vfs超级块,需要调用具体文件系统的fill_super方法来读取填充超级块。
那么下面主要集中在具体文件系统的fill_super方法,这里是ext2_fill_super:
分析重点代码如下:
3)ext2_fill_super源码分析
可以看到ext2_fill_super主要工作为:
1.读取磁盘上的超级块;
2.填充并关联vfs超级块;
3.读取块组描述符;
4.读取磁盘根inode并建立vfs 根inode;
5.创建根dentry关联到根inode。
下面给出ext2_fill_super之后ext2相关图解:

有了这些信息,虽然能够获得块设备上的文件系统全貌,内核也能通过已经建立好的block_device等结构访问块设备,但是用户进程不能真正意义上访问到,用户一般会通过open打开一个文件路径来访问文件,但是现在并没有关联挂载目录的路径,需要将文件系统关联到挂载点,以至于路径名查找的时候查找到挂载点后,在转向文件系统的根目录,而这需要通过do_new_mount_fc来去关联并加入全局的文件系统树中,下一篇深入剖析Linux文件系统之文件系统挂载(二)(超详细~) - 知乎 (zhihu.com)我们将做详细讲解。


