手把手教你写一个GDB（基本功能~）

2022-06-23 14:15 作者:补给站Linux内核 0人读过 | 我要投稿

什么是 GDB

GDB 全称 the GNU Project debugger，主要用来调试用户态应用程序。
根据官方文档介绍，GDB 支持调试以下语言编写的应用程序：

Ada
Assembly
C
C++
D
Fortran
Go
Objective-C
OpenCL
Modula-2
Pascal
Rust

当然，最常用的还是用于调试 C/C++ 编写的应用程序。
本文并不是 GDB 的使用教程，所以不会对 GDB 的使用进行详细的介绍。本文的目的是，教会大家自己动手撸一个简易的 GDB。所以阅读本文前，最好先了解下 GDB 的使用。
在编程圈中流传一句话：不要重复造轮子。但是本人觉得，重复造轮子才能真正理解轮子的实现原理。

ptrace 系统调用

GDB 实现的核心技术是 ptrace() 系统调用。

如果你对 ptrace 的实现原理有兴趣，可以阅读这篇文章进行了解：《ptrace实现原理》

ptrace() 是一个复杂的系统调用，主要用于编写调试程序。你可以通过以下命令来查看 ptrace() 的介绍：

ptrace() 系统调用的功能很强大，但我们并不会用到所有的功能。所以，本文的约定是：在编写程序的过程中，使用到的功能才会进行详细介绍。

可见，运行 ls 这个命令需要执行 40 多万条指令。

【文章福利】小编推荐自己的Linux内核技术交流群:【891587639】整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面，有需要的可以自行添加哦！！！（含视频教程、电子书、实战项目及代码)

简易的 GDB

我们要实现一个有如下功能的 GDB：

可以对一个可执行程序进行调试。
可以在调试程序时，设置断点。
可以在调试程序时，打印程序的信息。

下面主要围绕这三个功能进行阐述。

1. 调试可执行文件

我们使用 GDB 调试程序时，一般使用 GDB 直接加载程序的可执行文件，如下命令：

上面命令的执行过程如下：

首先，GDB 调用 fork() 系统调用创建一个新的子进程。
然后，子进程会调用 exec() 系统调用加载程序的可执行文件到内存。
接着，子进程便进入停止状态（停止运行），并且等待 GDB 主进程发送调试命令。

流程如下图所示：

我们可以按照上面的流程来编写代码：

第一步：创建被调试子进程

调试程序一般分为被调试进程与调试进程。

被调试进程：就是需要被调试的进程。
调试进程：主要用于向被调试进程发送调试命令。

实现代码如下：

上面的代码执行流程如下：

主进程首先调用 fork() 系统调用创建一个子进程。
然后子进程会调用 load_executable_file() 函数加载要进行调试的程序，并且等待主进程发送调试命令。
最后主进程会调用 send_debug_command() 向被调试进程（子进程）发送调试命令。

所以，接下来我们主要介绍 load_executable_file() 和 send_debug_command() 这两个函数的实现过程。

第二步：加载被调试程序

前面我们说过，子进程主要用于加载被调试的程序，并且等待调试进程（主进程）发送调试命令，现在我们来分析下 load_executable_file() 函数的实现：

load_executable_file() 函数的实现很简单，主要执行流程如下：

调用 ptrace(PTRACE_TRACEME...) 系统调用告知内核，当前进程可以被进行跟踪，也就是可以被调试。
调用 execl() 系统调用加载并且执行被调试的程序可执行文件。

首先，我们来看看 ptrace() 系统调用的原型定义：

下面我们对其各个参数进行说明：

request：向进程发送的调试命令，可以发送的命令很多。比如上面代码的 PTRACE_TRACEME 命令定义为 0，表示能够对进程进行调试。
pid：指定要对哪个进程发送调试命令的进程ID。
addr：如果要读取或者修改进程某个内存地址的内容，就可以通过这个参数指定。
data：如果要修改进程某个地址的内容，要修改的值可以通过这个参数指定，配合 addr 参数使用。

所以，代码：

的作用就是告知内核，当前进程能够被跟踪（调试）。
接着，当调用 execl() 系统调用加载并且执行被调试的程序时，内核会把当前被调试的进程挂起（把运行状态设置为停止状态），等待主进程发送调试命令。

当进程的运行状态被设置为停止状态时，内核会停止对此进程进行调度，除非有其他进程把此进程的运行状态改为可运行状态。

第三步：向被调试进程发送调试命令

我们来到最重要的一步了，就是要向被调试的进程发送调试命令。
用过 GDB 调试程序的同学都非常熟悉，我们可以向被调试的进程发送单步调试、打印当前堆栈信息、查看某个变量的值和设置断点等操作。
这些命令都可以通过 ptrace() 系统调用发送，下面我们介绍一下怎么使用 ptrace() 系统调用来对被调试进程进行调试操作。

send_debug_command() 函数的实现有点小复杂，我们来分析下这个函数的主要执行流程吧。

当被调试进程被内核挂起时，内核会向其父进程发送一个 SIGCHLD 信号，父进程可以通过调用 wait() 系统调用来捕获这个信息。
然后我们在一个循环内，跟踪进程执行指令的过程。
通过调用 ptrace(PTRACE_GETREGS...) 来获取当前进程所有寄存器的值。
通过调用 ptrace(PTRACE_PEEKTEXT...) 来获取某个内存地址的值。
通过调用 ptrace(PTRACE_SINGLESTEP...) 将被调试进程设置为单步调试模式，这样当被调试进程每执行一条指令，都会进入停止状态。

整个调试流程可以归纳为以下的图片：

测试程序

最后，我们来测试一下这个简单的调试工具的效果。我们使用以下命令编译程序：

编译之后，我们会获得一个名为 tdb 的可执行文件。然后，我们可以使用以下命令来调试程序：

例如我们要调试 ls 命令这个程序，可以输入以下命令：

可见，运行 ls 这个命令需要执行 40 多万条指令。

标签：

手把手教你写一个GDB（基本功能~）

什么是 GDB

ptrace 系统调用

简易的 GDB

1. 调试可执行文件

第一步：创建被调试子进程

第二步：加载被调试程序

第三步：向被调试进程发送调试命令

测试程序

手把手教你写一个GDB（基本功能~）的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

手把手教你写一个GDB（基本功能~）

什么是 GDB

ptrace 系统调用

简易的 GDB

1. 调试可执行文件

第一步：创建被调试子进程

第二步：加载被调试程序

第三步：向被调试进程发送调试命令

测试程序

本文作者的其他文章

手把手教你写一个GDB（基本功能~）的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

手把手教你写一个GDB（基本功能~）的评论 (共条)