外显子组测序如何工作?
首先,让我们简要地看一下“外显子组”是什么。
在DNA中,有两种类型的核苷酸(腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶)序列;内含子和外显子。由于外显子是我们这里的重点,我们将更详细地讨论它们。
外显子代表表达区域。外显子之所以被称为外显子,是因为这是被表达的DNA链的区域或区域。当RNA形成以编码特定氨基酸时,它是被转录的外显子,它是保守的。这就是所谓的“成熟的mRNA”(成熟的信使RNA),之所以这样称呼,是因为只剩下真正构建蛋白质的序列。然后这种成熟的mRNA与tRNA(转移RNA)一起工作,它们会产生蛋白质。

人类基因组包含233,785个外显子,其中80%的长度小于200个碱基对。因此,如果整个人类基因序列是“基因组”,那么整个外显子组就是外显子组。
当一项研究调查或基因图谱想要对外显子组进行测序时,他们的意思是对特定人的整个人类外显子组进行测序。这个过程与全基因测序没有太大区别,只是目标选择(技术上称为“目标富集”)是一个重要部分。因为外显子只占基因中基因序列的2%,所以它们非常重要。但他们必须退出序列。
这通常在DNA片段化后以两种方式之一完成:基于阵列的富集:微阵列用于捕获外显子。微阵列是与目标基因片段相对应的寡核苷酸碎片在这些阵列上移动,它们找到了它们“匹配”的寡核苷酸,并粘在它们上面。允许它们被分离,然后使用PCR技术相乘。溶液内富集:这是由化学物质组成的节拍,一种寡核苷酸纳米颗粒,这些被称为“探针”。这些现在被引入遗传物质,很像微阵列,它们粘附在珠子表面。然后对其进行洗涤和纯化。允许DNA片段被倍增和测序。对于大约3.5个magbases,这是一个非常有效的解决方案。然而,所讨论的技术取决于手头测序技术的选择。

综上所述,最基本的DNA测序技术就是凝胶电泳,这是很多人都熟悉的。

结果如下所示:

这是由于电流导致DNA穿过凝胶板,凝胶板留下条带,因为它们以不同的速度移动。这是低效且耗时的,因此我们开发了更新的技术。
在现代高通量系统中,这是通过自动化过程完成的。两块玻璃板有96条DNA通道,电流通过它们,机器读取轨迹。比手动凝胶电泳快得多。
然而,较新的高通量系统使用Sanger测序,即将少量DNA放入试管中,结合引物和四个链终止核苷酸,这些核苷酸被染料标记,溶液经过多轮加热。溶液准备好后,用凝胶将其强制通过非常小的毛细管。根据它们的大小,它们以不同的速度穿过这些毛细血管。当它们穿过管子的末端时,会有一束激光照亮它们,让核苷酸结合的再见发光,形成一个序列,称为色谱图。

然后是下一代测序,以及许多不同的方法,SMRT测序、纳米孔测序、大规模并行特征测序、微流体系统等等。将这些视为许多Sanger音序器,它们都以不同的方式小型化并同时运行。它非常快速和高效。还有其他技术正在开发中。
一旦该过程完成,遗传学家/生物信息学家(在某些情况下)必须分析数据,这里的第一步是过滤原始读数,这是机器产生的原始数据。有些会被忽略,有些会被添加到遗传学数据库中,并且会在这个过程中被“修复”。
全外显子组测序允许医学遗传学家、生物信息学家、分子生物学家,有时甚至是肿瘤学家,在给定基因中寻找可能导致特定疾病的特定突变。正如我上面所说的;外显子组可能只代表总基因序列的2%,但它负责所有蛋白质的形成。这意味着许多遗传疾病可以直接与外显子组相关。
虽然特定基因测序更省时,但通过全外显子组测序可以发现大量信息。随着高通量和下一代测序技术的不断成熟,我们将在更短的时间内看到外显子组测序的影响越来越大。这将使药物发现以更有效的速度发生。