基因检测原理及常见误解

2023-04-25 08:27 作者:历史基因溯源 0人读过 | 我要投稿

一直有个想法，把DNA检测的整个流程观念由浅入深，循序渐进的介绍出来，让大家更深入的了解DNA检测的原理，了解我们的本土原生犬，碍于我本身的懒惰，把这件事情一而再再而三的拖延，直至今日成篇，只能说对本土犬的爱最终超过了自己的惰性。

首先，既然说到由浅入深，循序渐进。在开始之前有必要先回顾一些初高中学过的生物学常识（已经了解的可跳过该段），狗的遗传信息存储在DNA中，DNA由脱氧核苷酸组成的大分子聚合物。脱氧核苷酸由碱基、脱氧核糖和磷酸构成。其中碱基有4种：腺嘌呤（A）、鸟嘌呤（G）、胸腺嘧啶（T）和胞嘧啶（C）。DNA中的核苷酸中碱基的排列顺序构成了遗传信息。基因是产生一条多肽链或功能RNA所需的全部核苷酸序列，该遗传信息可以通过转录过程形成RNA，然后其中的mRNA通过翻译产生多肽，形成蛋白质。蛋白质（protein）是组成人体一切细胞、组织的重要成分。DNA在复制过程中会发生可遗传变异，大部分突变都是有害的，甚至可能会造成死胎、自然流产和出生后天折等，称为致死性突变，少部分对机体无影响仅仅造成正常人体间的遗传学差异；甚至可能给个体的生存带来一定的好处。

突变为塑造生物的多样性提供了原材料，狗是人类历史上第一个被驯化的动物，其驯化史最早可追溯到1.7万年前末次盛冰期，有着漫长的历史，狗在跟随人类扩散至全球的过程中，随着地理隔离（种群被自然障碍物如山川河流或人类活动分割开来，无法自由交配）、遗传漂变（由于种群的隔离，每个种群的基因池变小，随机基因漂变的概率增加，导致基因频率变化）、自然选择（不同环境对不同表型具有不同的适应度，会导致某些表型的个体更容易生存和繁殖）、人工干预（人为控制家畜的交配，选育出具有合适性状的个体进行繁殖）的作用下不同品种不同地域间的狗积累了相当多的遗传差异性，这些遗传差异具体体现在DNA序列的差异上。

科学家正是通过比对不同个体的DNA序列差异来判断个体间的亲疏远近，通常情况下DNA序列越相似的个体亲缘关系越近，反之关系越远。同一个物种中大约有99.9%的DNA片段是相同的，其中约有0.1%的不同，同一物种的不同基因组DNA等位序列之间的差异称为DNA序列多态性，其中90%的多态性由单个核苷酸的变异所引起，被称为单核苷酸多态性（SNP），虽然整体比例只有0.1%左右，但是由于狗的细胞核中约有25亿的碱基对， SNP的数量可以到数百万甚至上千万个【1】。

基因检测可以粗略的分为这么两大步骤1.获取数据2.数据分析

一．获取数据：

检测机构从宠物体内的细胞样本中，如口腔拭子、血液、毛发等提取出DNA，通常使用化学方法或自动提取仪来完成。通过纯化步骤，去除DNA中的杂质和蛋白质，使得DNA更加纯净。利用PCR技术对提取出来的DNA进行扩增，从而增加检测的敏感性。对扩增出来的DNA进行测序或SNP分析，检测其中的基因变异。

需要注意的是宠物基因检测公司测序的DNA区域范围、SNP的数量、检测位点的准确度可能存在差异，导致测出不同的结果。通常情况下用于分析的SNP数量越多结论越准确，基因编码区域的位点优于非编码区。

二．数据分析

数据分析非常考验相关研究人员的水平和技术，宠物公司根据检测结果，将宠物的基因型与参考数据库进行比对，从而确定宠物的血统成分。参考数据库是指已经测序和分析过的基因数据的集合，通常用于比对和分析其他个体的基因数据。在宠物基因检测中，参考数据库是非常重要的，可以帮助解析宠物基因数据，从而确定宠物的品种、血统、疾病风险等信息。此外，一些商业公司也会建立自己的参考数据库，例如WisdomPanel、Embark等公司，它们通过自己的基因检测产品，收集大量宠物的基因数据，建立自己的参考数据库，从而为宠物基因检测提供参考数据。需要注意的是，不同的参考数据库可能存在差异，它们的数据收集、处理和分析方法可能不同，因此对于宠物基因检测结果的解读和比对，需要根据实际情况选择合适的参考数据库。

疑问一：

你上面不是说同一物种99.9%的基因片段都一样，为什么你发的伟思田园犬的基因检测结果会显示出各种不同比例的成分？

答：宠物基因检测的血统成分比例是根据基因中有差异的部分（通常是SNP）进行推断和预测的，并不代表基因序列的整体相似度，例如：人类和同科不同属的黑猩猩在约四百万年前就已经分化了，人类与黑猩猩的基因相似度高达98.5%，只有约1.5%的不同，而基因检测公司用来划分血统的是不同人种、族群间有差异的部分。

疑问二：

为什么伟思的土狗检测结果各种品种的成分都有，你说是纯的，embark检测的100%中国乡村犬的结果你又说是串？

答：主要原因是两家公司参考的数据库不一样，次要原因还包括数据分析方法的差异、数据准确度等等。宠物中的基因只是一段DNA序列，其本身是无法说明源自哪里的，靠的是与参考数据库里的数据进行比对，参考数据库的作用相当于给这些不同的基因位点做了品种标注，假设某些特殊的基因型在A品种中比例较高，宠物基因检测公司会将这些SNP上特殊的变异类型入库A品种，如果检测的宠物恰好也有这些特殊的基因型，宠物公司就会作出一个合理的判断，即检测的宠物有多少比例的A品种成分。

因此参考数据库很重要，要保证用于参考的数据库是符合历史事实的。参考数据库里录入的样本符合历史事实是非常重要的一步，否则得不出正确的结果。举个例子：某东非族群B自称祖先来自明朝郑和下西洋的舰队后裔，现某非洲小伙做基因检测，与参考数据库中B族群的基因对比，结果显示为100%的B族群成分，请问该小伙是否可以证明自己是百分之百的纯种中国人吗？

答案是否定的，单靠100%B族群成分无法证明是中国人，因为自称中国人后裔≠就是中国人后裔，要想证明，首先要证实明朝时期郑和下西洋曾经到达了该族群所在地区且与当地人有交流并留下后代，其次检测东非族群B还有多少东亚人群的基因成分。证实了东非族群B是郑和下西洋后裔并且依然还有不少的东亚成分这个事实，B族群作为参考数据库用于证明检测者是否有中国血统才有意义。

有些人把中国乡村犬当垃圾篓，也不关心检测到的结果是否接近地理位置相近的其他东亚犬种，全都往中国乡村犬的参考数据库里塞。或者说像中国冠毛犬这样，曾自称其来源于中国，但是基因分析却显示和东亚犬无关，哪怕测出100%，也只能证明你的宠物和embark参考数据库中的中国乡村犬/中国冠毛犬很相似，不能用于证明被检测的狗就是纯中国原生犬。

伟思的情况则相反，原有的广西猎犬基因库数据很少，导致田园犬的检测结果跑出其他亚太地区品种的成分，按照现在伟思检测一个入库一个的做法，只要你们检测的狗被伟思选中入库某个品种（很有可能入广西猎犬或者重新划分一个中华田园犬库），现在伟思还在研究当中，后续参考数据库一旦开始更新，狗的结果都会变成100%广西猎犬或者中华田园犬。到时面临着同样的问题：入库的基因数据是否符合历史事实，即这些基因是否就是中国自5千年文明起源以来一直伴随着先民的狗传承下来的。所以我一直在期待考古学和古分子生物学能够有所进展，可以作为参照来进行更合理的判断。

标签：

基因检测原理及常见误解

基因检测原理及常见误解的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

基因检测原理及常见误解

本文作者的其他文章

基因检测原理及常见误解的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

基因检测原理及常见误解的评论 (共条)