关于祖先分布区重建的一点笔记
开头先叠甲:这是为了后续学习BioGeoBEARS和RASP而特意学习一下相关理论的个人笔记,除了引用和转载的部分都是个人的理解内容,刚接触这方面,理解上肯定会有些偏差,别全信,最好直接看Matzke大佬的论文(开发模型和软件好香啊,那么多的引用,菜鸡眼馋)
祖先分布区重建的目的是为了探讨类群在地理上的起源、扩散和演化的历史过程,进而理解类群现在的分布格局、环境适应等问题。
对于一些背景知识和一些软件的介绍参照知乎大佬的文章,这里不赘述了(https://zhuanlan.zhihu.com/p/195632010)【以下图未经同意地转载于此】


理解祖先分布区重建主要需要理解主要的生物地理模型(以下一段引自:纪永坤, 2016.)
(1)扩散一灭绝分支进化(Dispersal-Extinction Cladogenesis,DEC)模型。除了扩散和灭绝之外,该模型还允许几种不同的分支进化情节发生。一是在祖先区域内的同域物种形成(sympatric speciation)。祖先物种的分布区(例如A)被简单的复制到两个后裔物种上,即两个后裔物种都分布在A。二是同域一子集物种形成(sympatric-subset speciation)。如果祖先物种同时分布在多个区域(如AB),那么两个后裔物种可以分别分布在AB和A。三是隔离分化(vicariance)。如果祖先物种分布区为ABCD,那么两个后裔物种可以分别分布在A和BCD,但是均匀划分例如AB和CD则是不被允许的。
(2)扩散一隔离分析(Dispersal-Vicariance Analysis,DIVA)模型。该模型允许所有的隔离分化情节,包括均匀划分和不均匀划分,但是不允许同域一子集物种形成。
(3)BayArea模型。该模型不允许同域一子集物种形成和隔离分化,但是允许广域的同域物种形成。

Matzke考虑到创始事件(founder-event speciation),引入了自有参数“j”,这个附加的参数允许后裔支系从祖先分布区扩散到另外的区域(可以是不相邻的区域)。创始事件,有时被称为通过长距离扩散形成物种或异域模式II物种形成,我个人的理解是:奠基者效应发展的新物种形成事件,就是指祖先物种的一部分种群从原来的分布区迁移到较远的新的地区,并在那里形成了新的物种,这里的j指的应该就是jump,这一参数的引入允许后代物种在地理分布上存在分断。用图例来讲的话,可以参照Matzke(2014)的例子。这里是用软件LAGRANGE的DEC模型作为参照,灰色标的是允许的分布演化事件。

目前“j”参数的应用已经得到了广泛的认同,在类群中有较多特有分布时具有较大的优势。
Matzke还加入了规定扩散概率与距离间函数的参数“+x”。概率与距离呈x次幂函数关系,默认x为0,即没有关系,x小于0时分布区离得越远,扩散的概率越小。Matzke也提到,“+x”参数还没有得到数据集额很好支持,使用的时候需要十分谨慎,他给对尝试使用这一参数的研究者列出了一大串的注意事项……
(“As you can see from the above, the +x model is new and not yet well-tested, so it should be viewed as experimental. Researchers should THINK about what the +x model is doing and what the results are saying, and do a variety of analyses to test their intuitions. I do believe the model is valid, and people should publish with it if they like, it just should not yet be viewed as a standard model that can be run blindly on defaults.”)http://phylo.wikidot.com/biogeobears#script
个人对“+x”参数的理解,仅供参考:这个参数是对“+j”的补充约束,“+j”提出了祖先物种扩展到新区域形成新物种的可能性,“+x”在此基础上进一步约束这个可能性。那么“+x”的适用范围就变得很小了,在岛屿模式(岛屿、沙漠中绿洲一类的地理分布)中,物种类群扩散到别的区域中确实存在着距离越远概率越小的状况(假设:风吹带到邻近绿洲、随着海浪漂到新岛上),但对于在同一块大路上扩散分化的类群来说,这个模型参数就不适用了。除此之外,这个参数在实践中表现出了一些其他的问题(Van Dam& Matzke, 2016):割裂的分布区如果距离过小隔离不彻底,那么这个概率函数就不相符;大的地理事件如路桥或河流改道等能够联通或阻断传播途径,这样就掩盖掉了这种稀有的概率事件;其他的地理环境如高山河流阻碍能力大于距离上的阻碍;有的物种能够飞行或通过其他物种的携带而长途跋涉,突破这种距离上的限制;等等。
通过“+x”参数的列子就可以知道,模型是为了模拟和规定类群演化历史进程的行为模式,考虑各种状况的可能性可能会更符合真实历史情况,但也可能是画蛇添足,模型的适合与否需要进行检验(如AIC等检验方法,不懂这方面),也需要考虑所研究的类群特性。

化石标定在分子钟物种分化时间的估计上已经有了较广泛的应用,虽然在进行祖先分布区重建时现多使用已经用化石标定过的树,但化石的位置信息没有利用上,然而化石样本的分布并不能直接认作该物种在当时的分布范围,实际的分布范围会远远大于化石的分布区域。合理利用化石的位置信息对分布区进行标定是十分有意义的,实践显示高质量的化石记录较完善的话,不管模型是否完善都能很好的重建(Matzke,2013)。……要是化石证据完善,根据化石就能知道分布和时间,这可是最直接的证据了,就是因为很多类群没有那么多化石去还原才需要模型来模拟啊。
接下来开始试试BioGeoBEARS和RASP的使用了
除链接的参考文献:
纪永坤.华溪蟹属的系统发生和多样化 [D]. 南京师范大学, 2016.
Matzke N J. Model selection in historical biogeography reveals that founder-event speciation is a crucial process in island clades[J]. Systematic biology, 2014, 63(6): 951-970.
Van Dam M H, Matzke N J. Evaluating the influence of connectivity and distance on biogeographical patterns in the south‐western deserts of North America[J]. Journal of Biogeography, 2016, 43(8): 1514-1532.
Matzke N J. Probabilistic historical biogeography: new models for founder-event speciation, imperfect detection, and fossils allow improved accuracy and model-testing[M]. University of California, Berkeley, 2013,:170-240.