欢迎光临散文网 会员登陆 & 注册

【学习笔记】遗传变异的基本类型

2023-03-21 14:03 作者:薛西弗斯和他的猫  | 我要投稿

遗传变异(genetic variation)是指在种群中个体之间的DNA序列的差异。遗传变异可以发生在生殖细胞(germ cells)中,也可以发生在体细胞中(somatic cells),但只有发生在生殖细胞中的变异可以遗传给子代。

遗传变异的主要来源是突变(mutations)和重组(recombination)。

突变是遗传变异的原始来源。DNA复制的时候常常会发生错误,在一般的情况下,这些错误会被DNA修复酶(DNA repair enzymes)所修复。当这些错误没有被修复而在DNA中保存下来时,这种错误就被称为新的突变(de novo mutation)。

图1.突变是遗传变异的原始来源。Image source: “The causes of mutations” Understanding Evolution. University of California Museum of Paleontology. 22 August 2008. 

突变实际上是一种中性的概念,大部分突变对机体不会有任何影响。

重组是遗传变异中另一种重要的来源。我们每个人都拥有来自父亲和母亲的遗传资料。重组是染色体的物理交换,多发生于二倍体生物的减数分裂期。重组可以产生与亲本不同的染色体。

图2.染色体重组。Image source: Creation Wiki.

一、遗传变异的类型

在学习遗传变异的类型之前,我们需要先区别几个概念

突变mutation和多态性polymorphisms和变异variant

一般而言,在全球所有人群中小于1%的变异被称为突变,大于1%的称为多态性,这实际上是一种人为的界定。变异则是二者的统称。

(一) 单碱基对替换(single base-pair substitution),单核苷酸多态性(single nucleotide polymorphisms,SNPs)和单核苷酸位点变异(single nucleotide variant,SNV)

不论是SNP或是SNV都有以下两种形式:

1.      转换(transition)是指嘧啶与嘧啶,或嘌呤与嘌呤之间的替换

2.      颠换(transversions)是指嘧啶与嘌呤之间的替换

个人认为,SNP与SNV实际上是同一种遗传变异形式在不同的对象人群中的名称。

SNP,即单核苷酸/碱基多态性是一个群体概念,是指某种基因的差异在整个群体中的占比大于1%以上时,则将其称为单核苷酸多态性。这种变异大多是发生在生殖细胞上的,人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。

SNV,即单核苷酸位点变异。例如在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。实际上,我们常说的点突变,其概念在狭义上就等同于单核苷酸位点变异。

SNV可能会导致以下几种改变:

图3.SNV导致的可能基因改变

1.      Stop gain(nonsense):即无义突变,突变后变成一个终止密码子,使得多肽链的合成提前终止,肽链长度变短而成为无活性的截短蛋白。

2.      Stop loss:终止密码子缺失,导致本应该终止的肽链继续延伸。

3.      Non-synonymous(missense):即错义突变,改变翻译成的氨基酸类型。

4.      Synonymous(silent):即同义突变,由于密码子存在简并性,虽然碱基发生改变,但是不改变翻译出来的氨基酸类型。

5.      Affect splicing:影响剪切。

(二)插入(insertion)与缺失(deletion),也被统称为“indel”

插入或删除单个DNA序列片段,长度范围从一个到数百个碱基对不等。

图4.插入和缺失的示意

当Indel发生在基因间区或内含子区时,对基因表型没有影响。

当发生在编码区(coding regions)时,又分为以下两种方式:

1.      移码突变(frameshifting

由非三的倍数个核苷酸的插入或删除造成,因基因表达时密码子是由三个核苷酸组成,此类插入或删除会改变阅读框架,进而使mRNA在此突变以后翻译出完全不同的蛋白质。框移突变在开放阅读框越上游的区域发生,对蛋白质的影响越大,且因框移突变可能会改变终止密码子出现的位置,也会改变翻译出蛋白质的大小,一般会使其完全失去功能。

图5.移码突变

2.      非移码突变(non-frameshifting

非移码插入/缺失突变是指可被三整除的核苷酸的插入或缺失,mRNA的读取框不会被破坏。由此产生的突变蛋白序列与野生型不同,一般为增加或删除一个或多个氨基酸残基。

 (三)结构变异(structural variation

主要是指大段的DNA序列发生变异的情况,一般是指大于1kb的序列(随着测序技术的发展,现在定义已经被延伸到大于50bp的序列)。包括大段的缺失、插入、重复、拷贝数变异(copy number variation)和染色体重排(chromosomal rearrangement)。

图6.常见的结构变异。缺失(deletion),新序列出入(novel sequence insertion),易变元素插入(mobile-element insertion),串联重复(tandem duplication),散在重复(interspersed duplication),染色体倒位(inversion)和染色体易位(translocation)


二、 染色体数量异常

最常见的例子就是21三体综合征,即唐氏综合征。这里不做过多赘述。


【参考文献】

  1. Alkan C, Coe BP, Eichler EE. Genome structural variation discovery and genotyping. Nat Rev Genet. 2011 May;12(5):363-76. doi: 10.1038/nrg2958. Epub 2011 Mar 1. PMID: 21358748; PMCID: PMC4108431.

  2. Pagel KA, Antaki D, Lian A, Mort M, Cooper DN, Sebat J, Iakoucheva LM, Mooney SD, Radivojac P. Pathogenicity and functional impact of non-frameshifting insertion/deletion variation in the human genome. PLoS Comput Biol. 2019 Jun 14;15(6):e1007112. doi: 10.1371/journal.pcbi.1007112. PMID: 31199787; PMCID: PMC6594643.

  3. 北京大学,生物信息学导论网络课,2013.


【学习笔记】遗传变异的基本类型的评论 (共 条)

分享到微博请遵守国家法律