mysql巧妙化解递归查询树形数据 | 纯sql

前言
开发中树形结构应该是很常见的一种数据结构了。而在数据库方面往往也都伴随相应的树形设计。在
mysql
中通过parent_id
来绑定其上游,从而达到树形结构的存储,但是在查询的过程中就需要我们将List
列表转成我们理想中的Tree
树。
构建树
相信大部分我们 都是通过
Java
来处理的。 其中getParentLocation
就是用递归不断的去构建上下级关系。这种方式也是我比较推荐的,因为这样就把职责分的很清楚Java
负责处理业务 ,数据库
就仅仅用来做数据的持久化,这也方便我们对数据库切换与升级。否则在更换其他数据库时还需要考虑是否支持递归属性。
有的时候为了能够量产化,这里我也针对项目的场景利用泛型进行一次封装。有兴趣可以自己针对自己的项目场景进行封装。这样树形与列表的转换就无须每次冗余了。然而今天我们的重点是如何利用
mysql
来实现递归查询, 虽然这种方式个人不推荐使用,但我们还是需要了解mysql
的特性的。

如图我们先在数据库中创建一张
test
表, 表里构建一棵树出来。祖父→父亲→孙子
。
请根据选中节点查询其上游关系
啥意思呢?就是根据你我想找到你家血脉关系。

这个业务本身没有难点,我们只需要一步一步的去寻找即可。但是从技术层面上看就有点搞头了。首先我们不确定是多少层,这就无法通过代码堆砌的方法进行实现了。只能动态的去递归查询。

通过上述代码我们即可完成家族血脉的查询。能够清楚的查出家族的具体支脉。
解析
上面的
sql
虽然能够实现递归,但是好像和我们平时接触的sql
不大一样。这里我们简单分析下
首先
mysql
是支持我们用户定义对象的。比如下面这个sql
执行上面的sql 你会发现查出来的就是
123
。 这就是使用到mysql
中变量定义功能。 通过@
来进行对象的定义以及赋值。

首先
mysql
的执行顺序是由里及外 。 就是说越在内部越先执行。所以针对上面的SQL
我们将它整理下顺序能够得出。

注意
(SELECT @r := parent_id FROM test WHERE id = _id) AS parent_id,
这段sql 实际上归属于第二层。图示中并没有列出,太占地方了。
第三层
有了上面的两个知识点铺垫,现在我们直接看
SELECT @r := 3, @l := 0
是不是就很容易明白了呢?r、l
就是mysql
中定义出来的两个变量。分别是3,0
。和我们上面演示案列中select @name from dual
是一个意思。至于
(SELECT @r := 3, @l := 0) vars, test AS h
这段就更好理解了。test本身就是一张物理表 , 我们定义出来的两个变量也可以理解成一张表。在mysql中查询两种表是为了区分开来正常都是需要各自取别名的。所以我们定义的变量就是vars
别名 。test
别名h
。
第二层
第二层可以说是递归的核心 。这里我们需要明白 上述代码为什么会产生递归的效果呢?首先我们知道
mysql
存在左外连接
、右外连接
、内连接
。除了这三种还有一种就是笛卡尔积
连接。什么意思呢?

也就是说上面我们的sql
FROM (SELECT @r := 3, @l := 0) vars, test AS h
就是为了给我们构建出一个笛卡尔积 ,而我们定义的变量其实就是一张表里的一条数据,所以这里就是将test
表所有记录都提取出来。


也就是说我们第二层的sql 就是将 test表全部查出来,然后将其字段进行扩展。说白了这种方式并不是一种真正的递归。但是因为引入了一个变量,所以在扩充的时候和递归一个效果。
但是笛卡尔积查询出来的数据是无法保证两张表的关联性的,所以我们并没有将
h
表相关字段查出来,因为那根本没用。剩下的就是我们一开始说的一步一步的查询扩充字段了
第一层
第一层就简单很多了 ,因为第二层就已经查询出来相关的树形数据了,但是因为第二层使用的笛卡尔积
h
表信息没法使用,仅仅使用了其数量。那么我们的名称这个时候还没有,第一层的作用就是将节点名称扩充出来。
总结
最后我们简单总结下,
mysql
的查询递归正常使用存储过程来实现。但是上面提到的方法巧妙的实现了递归的效果。理论上上述方法和存储过程相比存在一个优点就是不会死循环。
