欢迎光临散文网 会员登陆 & 注册

古代犬科动物起源的模块化解释狗的颜色模式(翻译)

2022-02-18 19:04 作者:历史基因溯源  | 我要投稿


概括

狗的独特颜色图案是犬类多样性的一个组成部分。颜色模式差异被认为是由狼驯化期间和之后的突变和人工选择引起的,但在理解这些模式如何进化和遗传控制方面仍存在重要差距。在其他哺乳动物中,ASIP基因的变异控制着黄色和黑色色素的时间和空间分布。在这里,我们确定了腹侧和毛发周期ASIP的独立调节模块表达,我们描述了它们的行为和进化起源。结构变异为每个调节模块定义了多个等位基因,并以不同的方式组合以解释五种不同的狗颜色模式。系统发育分析表明,其中一种模式的单倍型组合与北极白狼共享,其毛发周期特异性模块可能起源于 200 万多年前与灰狼分离的已灭绝犬科动物。更新世期间对较轻外套的自然选择为狗和狼的广泛颜色变异提供了遗传框架。

主题


家犬惊人的形态多样性的一个核心方面是它们的颜色和颜色模式。在许多哺乳动物中,特定的颜色模式是通过AGouti ( ASIP )的差异调节产生的, ASIP编码旁分泌信号分子和黑皮质素 1 受体 (MC1R) 的拮抗剂,导致毛囊黑色素细胞从制造真黑色素(黑色或棕色色素)转变为褐黑素(黄色至近白色色素)1 , 2 , 3 , 4。在实验室小鼠中,Asip表达由特定身体区域和毛发生长期间的特定时间的替代启动子控制,并产生轻腹刺鼠表型,腹侧毛发为黄色,背侧毛发包含黑色和黄色色素的混合物4。ASIP的遗传变异影响许多哺乳动物的颜色模式;然而,在狗中,这种情况仍未得到解决,这在很大程度上是由于不同模式类型的复杂性、与其他基因座变异的上位关系以及区分一个或多个变异的遗传关联是否真正代表因果变异或只是密切联系的挑战5 .

在这里,我们研究了ASIP调节模块中的非编码变异及其对家犬模式表型的影响。我们将我们的分析扩展到包括现代和古代野生犬科动物,并揭示进化史,其中更新世期间的自然选择为今天的颜色图案多样性提供了分子基质。

结论

ASIP的表达促进褐黑素的合成;因此,与黄色相关的ASIP等位基因对与黑色相关的等位基因占优势。虽然显性黄色 (DY) 在来自不同地理位置的狗中很常见,但现代狼最常见的毛皮图案是刺鼠 (AG) 6,其中背部有带状毛发,腹部较轻。另外三种颜色模式是可识别的,但在基因组分析之前,所有这些颜色模式在历史上都被不同的、不一致的、有时重叠的名称描述过;我们将它们称为阴影黄色(SY),黑色鞍形(BS)和黑色背(BB)(图1和补充表1)。

图 1:由ASIP控制的涂层图案。

左侧显示了由ASIP监管变化引起的五种模式类型的图纸,右侧显示了代表性照片。未显示由ASIP功能丧失的纯合子引起的完全黑色涂层。在每种图案类型中,可能会因其他因素而有所不同,包括: (1) 褐黑色和真黑色区域之间边界的位置,例如黑色马鞍形或黑色背面;(2) 褐黑素的阴影(红色至近白色);(3) 存在由非ASIP基因引起的黑色面膜或白色斑点;(4) 被毛的长度和/或卷曲。模式按优势顺序显示。

我们分析了可从具有显性黄色和黑色背部图案的狗获得的皮肤 RNA 测序(RNA-seq)数据,并确定了狗ASIP的三个替代非翻译第一外显子(图2a、扩展数据图1和补充表2)。如下所述,三个转录本中的两个在显性黄色和黑色背狗之间的丰度不同,并且相应的 5'-侧翼启动子具有与狗模式表型相关的序列变异。这两个转录本的 5' 侧翼启动子区域与实验室小鼠的腹侧启动子 (VP) 和毛发周期启动子 (HCP) 直系同源4;然而,我们的遗传分析(图2) 揭示了狗的 VP 和 HCP 产生了比老鼠更复杂的模式。与位于 VP 上游约 16 kb 的第三个启动子相关的转录本(图2b)在我们的数据集中没有变化。

图 2:不同颜色图案的家犬ASIP基因座的结构变化。

a,基因组上下文(NCBI 注释版本 105,CanFam3.1 程序集)。蓝色数字表示先前报道的变体关联——i(参考文献16)、ii(参考文献32)和 iii(参考文献17)——在讨论和扩展数据图2中提到。b、犬ASIP基因具有三个替代启动子和 5'-非编码外显子(核苷酸坐标表示它们的 3'-末端。腹侧和毛发周期特异性启动子的 1.5-kb 部分内的结构变异解释了狗的五种不同颜色模式。两种不同的VP 单倍型和五种不同的 HCP 单倍型示意性表示。星号表示与ASIP模式变异无关的第三个启动子和非编码外显子,如文中所述和图1.c,扩展单倍型组合如何相关的总结用一个或两个箭头表示半定量ASIP表达水平,或用 X 表示无表达(扩展数据图1)。


为了更好地理解启动子使用和模式表型之间的关系,我们检查了来自 77 个具有已知颜色模式的狗和狼样本的全基因组序列数据(补充表3)。我们使用在ASIP基因座纯合的狗来推断两种 VP 单倍型和五种 HCP 单倍型,由位于每个转录起始位点 1.5 kb 内的多个结构变体组成。VP1 包含一个相对于ASIP转录反向的 SINE 元件和在 VP2 中未发现的富含 A 的扩展(左图2b和补充表1);五个 HCP 单倍型根据 SINE 元素的数量和身份而有所不同,都在相同的方向ASIP以及额外的插入和删除(图2b右和补充表1)。所有结构变体都用 Sanger 测序精确描绘。

通过为 VP 和 HCP 结构变体开发基于 PCR 的基因分型分析,这些结果得到扩展,检查它们与来自 34 个品种的 352 只狗的不同模式表型的关联,并将这些结果与先前发表的变体进行比较(表1,扩展数据图2和补充表1和4-7)。如图2c和表1所示,VP1 或 VP2 与 HCP1、2、3、4 或 5 的双倍型组合与ASIP模式表型的变化完全相关。例如,VP1-HCP1、VP2-HCP1、VP2-HCP2 的纯合子分别是显性黄色、阴影黄色和刺鼠(补充表4 - 7 )。黑鞍犬和黑背犬的 VP 配置不同,但都携带纯合或复合杂合配置的 HCP3、4 和/或 5。由于ASIP活性的高低与黄色素的产生量直接相关,这些遗传关联结果表明VP1的活性大于VP2,HCP1的活性大于HCP2和HCP3,4和5都代表功能丧失,因为 HCP4 单倍型包括毛发周期第一外显子的大量缺失(图2b)并且不能补充 HCP3 或 HCP5(图3和补充表6 ))。重要的是,与黑色背表型相比,腹侧启动子(VP1 与 VP2)的活性增加与黑色马鞍中黄色素的背侧扩张相关(图1和2c),这表明 VP 和 HCP 单倍型彼此独立发挥作用。

表 1 ASIP双倍型与模式表型的关联
奇努克犬家族中的扩展单倍型组合表明,与 VP2、HCP3 和 HCP5 结合,都赋予了黑背表型。


描述不同 VP 和 HCP 单倍型的结构变异与ASIP转录活性之间的关系在来自背侧和腹侧狗皮肤活检的 RNA-seq 数据中进行了更直接的探索(补充表8和扩展数据图1)。RNA-seq 数据的读取计数与遗传关联结果的预期一致:VP1 具有更大的转录活性,并且相对于 VP2(仅在腹侧表达)在空间上变宽,HCP1 相对于 HCP2 具有更大的转录活性,并且没有读取从 HCP3 或 4 中检测到(图2b和扩展数据图1)。总之,这些结果为ASIP提供了分子解释狗的模式变异,其中 VP 和 HCP 独立发挥作用,并且与 VP 和 HCP 非常接近的结构变异调节启动子活性。

通过比较 18 只纯合狗的单倍型(VP 和 HCP 的结构变体和编码序列)与 10 只当代灰狼的单倍型(图4a和补充表9 )来检查变体ASIP调节模块之间的遗传关系。总体而言,刺鼠狗的单倍型与灰狼的相似。然而,占主导地位的黄色和在较小程度上阴影黄色狗的单倍型与来自埃尔斯米尔岛和格陵兰的北极灰狼相似,那里所有的狼都是白色的(图4a-c)。值得注意的是,狼的白色毛皮颜色代表苍白的褐黑素,如 Kermode 熊或雪鞋野兔7 , 8. 在包含 VP、HCP 和编码序列的 64-kb 片段中,北极灰狼单倍型除了一个多态性位点外是相同的(图4a,chr24:23,337,523),并且与狗显性黄色单倍型的区别仅在于六个单核苷酸变体(SNV)(补充表10)。综上所述,这些观察结果表明,在没有最近的基因交换的情况下,狗的主要黄色和狼的白色毛色的共同起源。

图 4:黄狗和白狼共享一个古老的 HCP 单倍型。

a ,灰狼和狗(行)中ASIP基因座的 377 个 SNV(列)的基因型,编码为杂合性(浅蓝色)、参考纯合性(黄色)或替代(深蓝色)等位基因或缺失基因型(白色的)。包括备用的第一个外显子(箭头)和附近的 DY 相关结构变体(正弦插入,绿色;多核苷酸扩展,橙色)以供参考。b,最大似然系统发育,包括七个现存的犬科动物物种和狗,分别来自 HCP 上游或下游的 48 和 16 kb 间隔。灰狼/狗的进化枝用方框突出显示,表示与全基因组系统发育一致(蓝色)或不一致(红色)的关系。C, 灰狼、北极灰狼和藏狼的图像。d,代表不同 HCP 进化历史的系统发育,从现存犬科动物的遗传变异中推断出来。结构变体(如图2所示)和衍生的 SNV(青色)区分狼样犬科动物(蓝色)、幽灵谱系(红色)和基础犬科动物(黑色)单倍型。


通过为狗、狼和另外八种犬科动物构建最大似然系统发育树,进一步探索了ASIP单倍型的进化起源(补充表9)。基于 SNV 频率的差异,48-kb VP 片段与 16-kb HCP-外显子 2/3/4 片段分开考虑(补充信息和图4a)。在 VP 树中,所有的狗和灰狼形成一个单一的进化枝,与已知的物种关系9一致。然而,在 HCP 树中,占优势的黄色和阴影黄色狗与北极灰狼一起处于一个单独的进化枝中;值得注意的是,这个进化枝是金豺的基础,与其他犬科动物不同(图4b和扩展数据图。3和4 )。

衍生等位基因共享的模式提供了额外的见解(图4d和扩展数据图5)。如图所示。如图2c和4d所示,HCP2 的特征在于所有犬科动物共有的三个小的重复元素,因此是祖先形式。在通向核心类狼犬科动物(金豺、土狼、埃塞俄比亚狼和灰狼)的分支中,HCP2-外显子 2/3/4 片段内有九个衍生的 SNV 等位基因(扩展数据图5和补充表11),其中四个位于靠近 HCP2 的重复元素的侧面(图4d和扩展数据图5)。九个衍生的等位基因中没有一个存在于主要的黄色 HCP1-外显子 2/3/4 片段单倍型中,该单倍型还带有接近 HCP1 的额外 SINE;因此,这种单倍型一定起源于金豺和其他狼类犬科动物的最后一个共同祖先 > 200 万年前 (Ma) 10。尽管 16-kb HCP1-外显子 2/3/4 片段单倍型可能起源于通向核心类狼犬科动物的分支,但它必须通过不完整的谱系分类和缺乏重组持续超过 200 万年,并且通过三个物种形成事件(补充信息)。更可能的情况是 HCP1 代表了来自已灭绝犬科动物的幽灵血统(图4d和5b) 是在更新世(下)期间通过与灰狼杂交而引入的,正如灰狼和土狼的祖先9以及高海拔西藏狼和喜马拉雅狼11所暗示的那样。

图 5:古代狗和狼中ASIP等位基因的分布,以及显性黄色获取的进化模型。

a,ASIP单倍型是从分布在整个北极地区的五只古狗(圆形)、两只远古狼(正方形)和 68 只现代狼(饼图)的 WGS 中推断出来的(扩展数据图7和补充表12显示了详细的单倍型表示)。星号表示 HCP1 插入缺失 (SY*) 或无法确定 (DY*) 的 SY/DY 单倍型。b, 主要黄色单倍型的起源及其传递给狗和北极狼的模型,其中模块化启动子的分子改变是通过基因渗入(红色,HCP1)或灰狼的突变(蓝色,VP1)获得的。影响灰狼传播的物种形成事件、狗驯化和地质事件的时间表基于先前研究10、33

我们将对 VP 和 HCP 单倍型的分析扩展到总共 45 只北美狼和 23 只欧亚狼。VP1-HCP1 单倍型组合主要在北美北极地区发现,其分布与白毛颜色平行(扩展数据图6a)12,在欧亚大陆未观察到。我们还鉴定了一种祖先 HCP1 单倍型变体,以下称为 HCP1 A,它不延伸到外显子 2/3/4 并且缺乏在北极灰狼和显性黄狗中发现的 24-bp 插入(图4d和扩展数据)图7 )。类似于阴影黄色的单倍型组合,VP2-HCP1 A,在来自西藏或内蒙古的七只浅色狼中观察到,它们代表了明显比其他欧亚种群轻的高海拔灰狼种群(图4d和扩展数据图6b)13

对这些单倍型人口统计历史的进一步了解来自对 4-35 千年前 (ka)的古狗 ( n  = 5) 和灰狼 ( n = 2) 全基因组测序 (WGS) 数据的分析(补充信息)和补充表12),其中以各种组合观察到两种形式的 VP(VP1 和 VP2)和四种形式的 HCP(HCP1 A、HCP1、HCP2 和 HCP4)(图5a和扩展数据图7) . 来自北极西伯利亚泰米尔湖和雅纳河地区的古狼至少有一种 HCP1 单倍型,而来自中欧、爱尔兰和西伯利亚的古狗则携带 HCP1 A,HCP1 和 HCP4 分别(补充表12)。因此,今天负责颜色变化的ASIP调节序列的多样性在古代狼中为 35 ka,在古代狗中为 9.5 ka,这一点很明显。

连同我们的系统发育结果,狼和狗ASIP单倍型的比较分析表明,在进化历史中,多种衍生单倍型和相关的颜色模式是由对应于白狼 (VP1-HCP1) 和灰狼的两种祖先配置的重组和突变产生的(VP2-HCP2),两者都存在于晚更新世(图5a和扩展数据图7)。衍生单倍型的分布不仅解释了狗的颜色模式多样性,而且解释了整个北极圈现代狼种群的颜色模式多样性,包括北美北极的白狼 (VP1-HCP1) 和西藏高地的黄狼 (VP2-HCP1 A) 并且与浅色被毛颜色的自然选择一致。图5b描绘了驱动高水平ASIP表达的模块起源的可能时间线,并指示了双重起源。HCP1 单倍型代表从一个已灭绝的犬科动物谱系向更新世灰狼的基因渗入,该谱系从灰狼>2 Ma 分化而来。根据对古代狼样本的直接观察,这种基因渗入以及从 VP2 到 VP1 的突变发生在 33.5 ka 之前(图5a)

讨论

一个多世纪前,Sewall Wright 14认识到ASIP与狗颜色模式之间的关系,并在随后的几十年中由 CC Little 的工作进行了深入探索15。先前的研究报告了与某些狗的颜色模式相关的ASIP区域内或周围的分子变异,包括与黑色鞍座16相关的 16 bp 非编码重复、与黑背和黑色鞍座16相关的 SINE 插入以及错义变体 A82S 和R83H 与显性黄色17相关(图2a和扩展数据图2)。如此处所示,更广泛数据集的可用性表明这些先前报道的关联代表连锁不平衡和/或品种结构,而不是因果变异(补充表7)。相反,我们基于 WGS 对该区域的综合注释以及 RNA 表达数据揭示了一系列结构变体,这些变体为两个启动子中的每一个定义了不同的单倍型,它们结合起来解释了五种不同的模式类型(图2c)。

在狗中,VP1 和 VP2 之间的主要区别是一个 SINE 元素和一个小插入;同样,HCP1 和 HCP2 之间的主要区别在于多个 SINE 元素和一个小的插入(图2b)。在每种情况下,我们还不知道转录差异(VP1 > VP2 和 HCP1 > HCP2)是由 SINE 元素、小插入还是两者兼而有之。然而,我们注意到,ASIP调节变异的模块化是脊椎动物的一个普遍主题,非编码变化推动了鹿鼠3、山野兔18、雪鞋野兔8和几种鹦鹉莺19、20的自然种群的适应,21 , 22. 同样,山羊23、家兔24、25和实验室小鼠26的人工选择与ASIP调节区域的结构变化相关,这可能导致获得调节 ASIP 区域特异性表达的启动子。

ASIP颜色图案多样化可能是狗驯化过程中的一个早期事件,因为我们对古代 DNA 数据的分析揭示了欧亚大陆 4.8 ka 的几种不同的 VP 和 HCP 单倍型。这与来自不同地点的现代犬种的主要黄色广泛分布一致,以及野狗(补充表9),一种野生驯化,经常占主导地位的黄色,至少 3.5 ka 引入澳大利亚(参考文献27)。特别感兴趣的是来自西伯利亚的佐科夫岛犬28 , 29. 在VP2-HCP4的单倍型组合的基础上,这只活9.5ka的雪橇犬呈现出黑色的背色图案,使其在北极环境中很容易与白色的狼区分开来。

在狼群中,VP1 和 HCP1 的自然选择可能是更新世适应北极环境和冰川避难所的遗传交换的结果,这是由间冰期犬科动物和巨型动物的扩散驱动的。现代灰狼被认为起源于单一来源~25 ka,接近最后一次冰川最大值30 , 31;在随后的北美冰川退缩期间,VP1-HCP1 单倍型组合被选择用于今天的白色北极狼。我们的研究结果显示了基因渗入、人口历史和已灭绝犬科动物的遗传遗产如何在塑造狗和现代灰狼的多样性方面发挥关键作用。

注脚:

道德声明

所有动物实验均按照当地法规进行。实验得到了“州动物实验委员会”(伯尔尼州;许可证 48/13、75/16 和 71/19)的批准。

皮肤活检和总 RNA 提取

由于与本研究无关的原因,在尸检和/或手术中从三只狗(黑背微型短毛猎犬和占主导地位的黄色边境梗和爱尔兰梗)中回收了皮肤活检(6 毫米穿孔)。活检取自腹腹和背胸,与年龄或毛发生长周期不匹配。活检立即放入 RNAlater (QiAGen) 中至少 24 小时,然后在 –20 °C 下冷冻。在提取 RNA 之前,使用来自 QiAGen 的 TissueLyser II 设备对皮肤活检进行机械均质化。根据制造商的说明,使用 RNeasy Fibrous Tissue Mini Kit (QiAGen) 从匀浆组织中提取总 RNA。使用片段分析仪(AGilent)评估 RNA 质量,并使用 Qubit 荧光计(ThermoFisher Scientific)测量浓度。

全转录组测序(RNA-seq)

使用 Illumina TruSeq Stranded mRNA 试剂盒从每个样品中提取 1 μg 高质量总 RNA(RNA 完整性数 > 9)用于文库制备。使用 Illumina NovaSeq 6000 仪器对文库进行单独条形码化和汇集,并在 S1 流动槽上进行 2 × 50 bp 双端测序。平均而言,每个样本收集了 3150 万条配对末端读数。使用了一个公开可用的 BeAGle 样本 (SRX1884098)。所有登录号和描述性读取统计数据在补充表8中给出。所有通过质量控制的读数都使用 STAR aligner (v.2.6.0c) 34映射到 CanFam3.1 参考基因组组装。

成绩单坐标

STAR-aligned bam 文件在集成基因组查看器 (IGV) 浏览器35中可视化。根据刚刚描述的 RNA-seq 数据,基于 IGV 中读取比对的可视化,定义了三个不同的交替未翻译的第一外显子,它们与ASIP的编码外显子具有剪接点。这些确切的成绩单没有记录在国家生物技术信息中心(NCBI)中;然而,NCBI 注释版本 105 的三个转录本实际上是相同的,除了关于 5' 非翻译区长度的微小差异(XM_014106843.2,与我们的注释相比,转录起始父系 (TSS) 上游 22 个核苷酸;NM_001007263.1,VP1-TSS 98 bp 下游我们的注释;XM_022408819.1 HCP-TSS 36 bp 我们注释的下游)。我们的视觉策划基因模型在补充表2中给出。

基因组变异的鉴定

来自 71 只狗和 6 只狼的 WGS 数据用于变异发现(补充表3)。其中包括15只刺豚鼠和狼、25只黑背狗、11只黑鞍狗、14只显性黄狗、11只阴影黄狗和1只白狼。这些基因组要么是公开的,要么是作为我们小组相关项目的一部分进行测序的36。SNVs 和小插入缺失被称为描述36。IGV 软件35基于 RNA-seq 数据中鉴定的转录本,用于目视检查三个启动子区域。通过在 IGV 中的目视检查,鉴定了结构变体并验证了与毛色表型的关联。第三个启动子的拷贝数变异模式与图1中定义的外壳模式无关。

用于 Sanger 测序和基因分型的 DNA 样本

用于变异发现的样本包括来自每种颜色表型的两只狗,并在补充表3中用星号表示。来自补充表4中列出的狗的样本用于基因分型。所有动物的毛色表型(补充表3和4)是根据特定品种的毛色标准或照片或所有者报告分配的。使用 Maxwell RSC 全血 DNA 试剂盒 (Promega) 从 EDTA 血液样本中分离基因组 DNA。

启动子区域的测序

对 PCR 扩增子进行 Sanger 测序,以在序列水平上验证和表征启动子区域的结构变体。使用的所有引物序列和聚合酶列于补充表5中。使用 LA Taq 聚合酶 (Takara) 或 Multiplex PCR Kit (QiAGen) 扩增的 PCR 产物在用核酸外切酶 I 和虾碱性磷酸酶处理后直接在 ABI 3730 毛细管测序仪上测序。用 Sequencher 5.1 (GeneCodes) 分析序列数据。使用RepeatMasker 程序37对散在的重复插入进行分类. 以这种方式解决了来自相同和不同系列的 SINE 元素的多个副本。CanFam3.1 参考基因组组装来自 Boxer Tasha,一种显性的黄狗,代表ASIP基因的 DY 单倍型 VP1-HCP1。HCP2-5 的启动子变体和 Genbank 登录号的描述在补充表1中。补充表1列出了在狗中观察到的 VP 和 HCP 调节模块的七种组合。由于 HCP3、4 和 5 都代表功能等效的功能丧失等位基因,因此列出的七种组合仅对应于五种不同的表型。

基因分型分析

需要五次 PCR 测定(腹侧启动子测定 1 和 2 以及毛发周期启动子测定 1、2 和 3)来明确确定 VP 和 HCP 单倍型(补充表5)。先前报道的 SINE 插入32在 ABI 3730 毛细管测序仪上通过片段大小分析进行基因分型,并使用 GeneMapper 4.0 软件(applied Biosystems)进行分析。先前报道的ASIP编码变体17通过 PCR 产物的 Sanger 测序进行基因分型。先前报道的RALY内含子重复16在片段分析仪(安捷伦)上通过 PCR 产物的大小差异进行基因分型。另一对引物用于扩增整个 HCP(补充表5)。所有样品的基因分型结果显示在补充表4中。352 只狗存在完美的基因型-表型关联(表1和补充表7)。在剩下的 14 只狗中,存在 eumelanistic 面具阻止了显性黄色和阴影黄色狗的可靠表型分化。品种和在每个品种中鉴定的不同启动子单倍型组合在补充表6中显示. 在一些 VP 和 HCP 都是杂合子的狗中,VP 和 HCP 单倍型组合的定相是根据所述同一品种内的单倍型频率进行的。一个支奴干家族用于确定扩展单倍型的分离以及 HCP3 和 5 的表型等效性(图3)。基因分型结果的总结和先前相关变体的排除见表1和补充表7。补充表7列出了聚合形式的基因型-表型关联;它还包含先前报道与模式表型 16、17、32 相关的变体的基因型。

启动子单倍型对转录本影响的比较

转录数据是从第二组样本中生成的。样品描述和颜色显示在补充表8中适用于所有 RNA 实验。由于与皮肤无关的行为或健康问题而进行的安乐死后,从雄性瑞典麋鹿 (AGouti)、雌性德国短毛猎犬 (主要黄色) 和雄性罗威纳犬 (黑背) 中收集皮肤样本。样品收集在 RNAlater Stabilization Solution 中并储存在 –80 °C。根据制造商的说明,使用 RNeasy Fibrous Tissue Mini Kit (QiAGen) 提取 RNA。使用 AGilent 2100 生物分析仪或 TapeStation 系统 (AGilent) 评估 RNA 的完整性,并使用 DeNovix DS-11 分光光度计 (DeNovix Inc.) 测量浓度。STRT(单细胞反向标记)RNA-seq 文库是使用具有唯一分子标识符的 STRT 方法制备的38和修改,包括更长的 8 bp 唯一分子标识符、添加 ERCC 对照 RNA 中的尖峰以使表达正常化以及使用 LNA 引物用于犬 α 和 β 珠蛋白基因的 Globin lock 方法39 。使用 Illumina NextSeq 500 对文库进行测序。使用 HISAT1 mapper v.2.1.0(参考文献40)将读数映射到 CanFam3.1 基因组构建。

无比对量化方法 Kallisto (v.0.46.0) 41用于估计丰度,并根据 CanFam3.1 Ensembl 转录组(版本 99)构建的索引,将其量化为每百万映射读取 (TPM) 数据的转录本. 基于 IGV 浏览器35中的比对可视化的策划ASIP转录亚型模型也包含在转录组中。基于启动子单倍型基因型的结果在扩展数据图1中显示为 TPM。

单倍型构建

单倍型由两个公开可用的 VCF 文件PRJEB32865和PRJNA448733 构建。所选狗的 VCF 使用 BCFtools 合并工具 ( http://samtools.github.io/bcftools/ ) 与参数 --missing-to-ref 合并,假设缺失位点的基因型是纯合参考类型 0/0。只有ASIP单倍型(VP、HCP 和编码外显子)纯合的狗用于可视化单倍型(补充表3)。在这些样本中具有 100% 检出率的 SNV 进行了颜色编码,并相对于基因组组装和先前相关的变体显示(扩展数据图2)。

犬科动物的ASIP系统发育分析

36 种犬科动物(包括 7 种现存物种和狗)的 Illumina 全基因组序列从 NCBI 短读长档案中下载为对齐(bam 格式)或未对齐(fastq 格式读取(补充表9))。在使用 Trim Galore (v.0.6.4) 修剪后,使用 BWA (v.0.7.17) 42将 Fastq 数据与狗基因组 (CanFam3.1) 对齐。包括ASIP转录单位和调控序列在内的 110 kb 区间 (chr24: 23,300,000–23,410,000) 内的 SNV用鸭嘴兽 (v.0.8.1) 43进行鉴定,并用 VCFtools (v.0.1.15) 44过滤到包括 2,008 个双等位基因 SNV。使用 BEAGLE (v.4.1) 45推断相位。

对于系统发育分析,基于狗 SNV 密度(图4a)和ASIP基因结构, ASIP区间被划分为两个区域:一个 48-kb 区域,包括腹侧第一外显子,延伸到但不包括毛发周期第一外显子(chr24:23,330,000–23,378,000) 和一个 16 kb 区域,包括毛发周期第一个外显子,延伸到并包括ASIP编码外显子 2–4 (chr24: 23,378,001–23,394,000)。使用 BCFtools (v.1.9) 为每个推断的犬单倍型构建了相等长度的共有序列。系统发育是使用最大似然法和 Tamura-Nei 模型推断的,具有 250 次自举复制,在 MEGAX中实施46、47并包括 34 只犬科动物(图4b和扩展数据图3和图4)。对于 36 个个体中的 34 个,共有单倍型对彼此相邻,或者在少数狼/狗单倍型的情况下,位于具有弱引导支持的相邻分支中。非洲金狼是个例外,它是灰狼和埃塞俄比亚狼9和来自五大湖地区的东部灰狼最近杂交衍生的物种,据报道它最近也与土狼混合48。将非洲金狼和东部灰狼从比对中移除,并任意选择每个个体的单个单倍型用于树木构建和展示。

古犬狼ASIP位点单倍型分析

来自最近几项研究的 WGS 数据9、13、29、49、50、51、52、53,包括五只古代狗、两只古代灰狼和 68 只现代灰狼(补充表12)被下载为对齐(bam 格式)或未对齐(fastq 格式)读取。在使用 Trim Galore (v.0.6.4) 修剪后,使用 BWA-MEM (v.0.7.17) 42将 Fastq 数据与狗基因组 (CanFam3.1) 对齐。每个样本的覆盖深度范围为 1 到 78 倍(补充表12)。使用 IGV 浏览器通过目测确定五个结构变体和六个 SNV 的基因型(补充表1和12)。腹侧启动子 ( n  = 2)、毛发周期启动子 ( n  = 6) 和编码外显子 ( n = 3)中或附近的变体 区分腹侧和毛发周期启动子单倍型(补充表12)。SNV 基因型由等位基因计数确定;通过断点连接处的拆分读取对结构变体进行基因分型。用于绘制单倍型地理分布的基础图(图5和补充图6)是在 R(v.4.0.3)中使用“maps”和“ggplot2”包生成的。

对于 75 只狼(或古老的狗)中的 67 只,腹侧和毛发周期启动子单倍型的阶段是明确的。七只狼和一只古老的狗在腹侧和毛发周期启动子单倍型方面是杂合的,对于这些样品,单倍型阶段是根据 67 个明确个体中的连锁不平衡推断的。


古代犬科动物起源的模块化解释狗的颜色模式(翻译)的评论 (共 条)

分享到微博请遵守国家法律