欢迎光临散文网 会员登陆 & 注册

系统发育基因组学分析揭示了蜜蜂和蜂(膜翅目)在完全变态昆虫辐射演化中的基础位置

2022-07-14 02:33 作者:躲在被窝里看文献  | 我要投稿

DOI:10.1101/gr.5204306

 


摘要

        比较研究需要了解分类单元之间的进化关系。然而,形态学数据和古生物学数据都不能很好的解决完全变态昆虫主要类群之间的发育关系问题。这里,我们使用了一种新的基因组方案,拼接和分析了185个核基因组成的数据集,选用完全变态昆虫中主要类群的一些模式生物很好的解决了这一问题。相对于人们广泛认同的假说,蜜蜂和蜂(膜翅目)才是甲虫(鞘翅目)、蛾(鳞翅目)和苍蝇(双翅目)这些主要完全变态目的基础。我们仔细分析了每一个潜在干扰因素,验证了我们结论的准确性。因此,系统发育基因组学方法能够解决长期存留的昆虫系统发育相关问题。

科学问题

        完全变态昆虫四大目的系统发育关系如何?影响系统发育树拓扑结构的因素有哪些?如何检验其拓扑结构是否正确?

 

已有假说

        昆虫在个体发育中,完整经过卵、幼虫、蛹和成虫等4个时期的叫完全变态昆虫。昆虫纲中最大的几个目都属于完全变态昆虫(鞘、鳞、膜、双),而像半翅目、直翅目等就属于不完全变态昆虫。在2006年之前,完全变态昆虫中的主要四大目已经被证实具有同一祖先,但它们之间的系统发育地位并不是很清楚,普遍认为脉翅亚群中的鞘翅目应该早于其余三目(长翅亚群)的分化。


学术思路

        作者选定四大目中的一些模式种(易获得其基因组等相关数据)和已经被证实为构建完全变态昆虫系统发育树的最好外群,获取其表达序列(EST)信息。通过不同的建树方法构建系统发育树,并分析各种可能导致误差的原因。因此,从不同方面对其拓扑结构进行验证,从而得到最终的结果。流程:


引言

        完全变态昆虫的主要四大目(膜翅目、鞘翅目、鳞翅目、双翅目)在所有已知动物的占比中超过了45%。基于形态学、单个分子标记或线粒体DNA序列都证明了这些目的单源性,但从这些方面都不能很好的证明这些目之间的联系。

        双翅目(蝇)和鳞翅目(蛾)之间的紧密联系在长翅亚群中得到了证实。然而,鞘翅目(甲虫)和膜翅目(蜜蜂和蜂)之间的系统关系确仍然不明确。人们广泛接受的系统发育假说为长翅亚群和膜翅目是姐妹群的关系,因此,作为脉翅亚群姐妹群的鞘翅目在四个目的系统发育中应该处于更基础的位置。

        为了解决完全变态昆虫主要目之间的系统发育关系,我们采取了系统发育基因组学的方法,使用大量核基因去优化系统发育建树结果。基于同时分析大量核基因的此方法已经被证明是深入理解后生动物系统发育关系的一条有希望的途径。这里,我们证明该方法同样能够解决昆虫系统发育学上一些长期存留的问题。

        使用表达序列标签(EST)序列作为系统发育的基础数据是被证实为可行的,在昆虫系统发育基因组学研究中使用表达序列标签序列可追溯到2002年,但利用有效的数据去解决问题只到近年来才变得可行。

        我们的实验基于6个模式物种(完全变态昆虫),是因为它们的测序工作已经完成或正在进行。包括两个双翅目昆虫(黑腹果蝇、冈比亚桉蚊),一个鳞翅目昆虫(家蚕),一个鞘翅目昆虫(赤拟谷盗)、两个膜翅目昆虫(意大利蜂、丽蝇蛹集金小蜂和吉氏金小蜂)。此外,我们选用了两个研究完全变态昆虫系统发育时公认的外群,直翅目的东亚飞蝗和半翅目的豌豆长管蚜。

方法

        作者从Ensembl数据库(www.ensembl.org)下载黑腹果蝇、冈比亚桉蚊、西方蜜蜂的多肽序列,从NCBI数据库(ftp.ncbi.nlm.nih.gov)下载家蚕、赤拟谷盗、东亚飞蝗、豌豆长管蚜的mRNA序列,两种金小蜂则是作者提取了其表达标签序列。所有的核酸序列数据集都用SeqClean (available from www.tigr.org/ tdb/tgi/software/) 除去线粒体DNA、细菌DNA等潜在污染,然后使用cap3(默认设置)进行非冗余拼接。所有的核酸数据集都与黑腹果蝇的蛋白质数据进行BLASTx。最佳命中的阅读框被认为是正确的阅读框。然后选择最长的不被终止密码子打断的肽段作为每个核苷酸序列对应的肽段。

        我们对所有蛋白质组对进行了BLASTp搜索。根据最佳BLAST比对选择同源序列,E值设置为小于10-25。如果每个序列在各自的蛋白质组中都有最佳BLASTp比对结果,一组序列在每个物种中都有一个成员是被接受的,作为候选同源基因家族。这种所有对所有最佳命中的要求是非常严格的,因此在推断的同源性上有很高的可信度。多重序列比对使用MUSCLE(默认设置)。对比对结果进行检查,以确保其完整性和一致性。保守度较差的家族或可能包含旁系同源的簇被丢弃。对于金小蜂科,当两个物种都有同源序列时,选择较长的序列。在Gblocks(高精度设置)上去除比对结果中的空格和可信度较低的比对区域,所有序列两侧部分应该为保守区域,这部分区域中的氨基酸不能小于20个。我们将最终的185个核序列(大多数为管家基因),8个物种的33 809个氨基酸位置串联起来进行系统发育分析。

        首先在phyML上对数据集进行了最大似然法建树,采用了氨基酸替代经验模型,即所有位点的替代速率符合伽玛分布,随后采用氨基酸进化替代模型得到了同样的结果。此外,我们用MrBayes评估了这个系统发育树的可信度,采用了与上述相同的序列进化模型。我们进行了四次独立的搜索,每次都从一棵随机的树开始,每十棵树抽样一次,超过10万代。在每次运行不到1000代就达到平衡时,前100棵树被认为是老化的。每次独立运行最后得到的结果都是一致的。最后,我们还使用PHYLIP包中的PROTPARS,在最大简约准则下分析了1000个bootstrap重复的可信度。

        为了检验得到的树是否由一个或少数几个基因主导,我们对完整基因重采样获得的1000个bootstrap数据集进行了最大似然分析。对于每一次重复,我们从上述完整的数据集中提取了185个基因比对。由于基因在被选择后没有从数据集中移除,每个bootstrap数据集不止一次包含一些基因比对,而其他的则完全缺失;这类似于广泛使用的基于单个氨基酸位点的自助策略。对于每个重复都采用上述的phyML分析。

        为了确定鞘翅目和膜翅目的相对位置是否由这两个目之间的比率差异引起,我们在金小蜂和赤拟谷盗间进行了相对比率试验。我们将这一分析和随后的树重建限制在与东亚飞蝗和豌豆长管蚜相同的位点,从而可靠地推断出它们的祖先位点。为了更加保守,我们移除了所有在卡方检验下,X2>1.64,P<0.2的基因。除了意大利蜜蜂外,我们将剩下的114个基因拼接成16,495个氨基酸序列。分析采用如上的最大似然法。

        我们还如上所述,使用最大似然法分析了每个个体的蛋白质比对。为了分析figure1中每个蛋白质对树的支持情况,与之前假设的树(膜翅目昆虫和赤拟谷盗交换了位置)进行比较,我们比较了每种拓扑结构下计算的可能性;在PAML包中使用Kishino 和 Hasegawa (1989)的方法估计了统计学支撑。

        物种与物种之间的组成不均一性采用卡方检验进行评估:


fmi表示物种m中i型氨基酸串联的总数。Table 3中的值是基于密码子GC含量偏多的氨基酸(FYMINK/GARP,Table 2,自由度为9)。当使用所有氨基酸时,可以得到性质非常相似的结果(不展示数据)。

        作者的所有系统发育基因组学分析和测试都是在Perl脚本中实现的,这些脚本可在补充材料中获得。

 

结果与讨论 

        多种建树和检验结果近乎100%(Table 1)的支持Figure 1中树的拓扑结构。先前普遍认为的双翅目与鳞翅目的系统发育关系在树中得到了体现。然而,在完全变态昆虫四大目的系统发育关系中,膜翅目处于一个更基础的位置,而不是鞘翅目。

        在系统发育建树构建的过程中,碱基组成偏好性与长支吸引可能会导致结果错误。我们实验中的两个物种,豌豆长管蚜和意大利蜜蜂,基因组中AT碱基含量偏高,可能导致密码子中含AT碱基的氨基酸偏多(Table 2),对此进行了统计学分析(卡方检验、Table 3)。移除豌豆长管蚜和意大利蜜蜂后,所得系统发育树的拓扑结构与上述一致。

        因为内群中的双翅目与鳞翅目之间最可能发生长支吸引,但系统发育树所反映的两者之间的关系与大家公认的结果一致(已通过形态学和化石证据证明),因此长支吸引是不太影响上述树的拓扑结构。然而,即使膜翅目昆虫和赤拟谷盗的分支很短,仍然可以想象在这些物种中具有特定替代率的基因可能会导致系统发育的偏差。在相对比率测试的基础上排除这些基因,并没有改变树的拓扑结构(Table 1)。

        不当的外群选择可能会潜在地影响内群系统发育关系。虽然我们的两个外群物种在进化速率和氨基酸组成上有很大的差异,但当分别使用东亚飞蝗和豌豆长管蚜作为外群时,建树结果保持不变(Table 1)。

       传统的形态学特征所支持的长翅亚群(膜翅目)、脉翅亚群(鞘翅目)之间的关系与我们所得的结果不一致,之前的认识是在系统发育关系上将两个亚群完全割裂开的,这是不正确的。在以前的分子系统发育研究中并没有发现这一问题,是因为之前的系统发育关系研究并没有使用基因组这样大的数据集。基于单基因重建系的统发育树与上述树具有相同的拓扑结构,但没有较高的bootstrap值支持(Table 1)。因此,大量序列的联合分析对于解决完全变态昆虫目之间的深层进化关系是必要的。 

结论

        通过传统形态学特征和只使用几个分子序列来构建系统发育树是存在局限性的,本文就是一个很好的列子,长翅亚群与脉翅亚群昆虫在系统发育上并不是完全割裂开的。同时,系统发育基因组学方法在对于解决完全变态昆虫目之间的系统发育问题上很好的前景。

本研究的不足

        受限于当时(2006)的测序技术和计算机功能,所选用的实验对象数量比较少,同时也局限于模式物种中。


系统发育基因组学分析揭示了蜜蜂和蜂(膜翅目)在完全变态昆虫辐射演化中的基础位置的评论 (共 条)

分享到微博请遵守国家法律