【学习笔记】遗传变异的基本类型

遗传变异(genetic variation)是指在种群中个体之间的DNA序列的差异。遗传变异可以发生在生殖细胞(germ cells)中,也可以发生在体细胞中(somatic cells),但只有发生在生殖细胞中的变异可以遗传给子代。
遗传变异的主要来源是突变(mutations)和重组(recombination)。
突变是遗传变异的原始来源。DNA复制的时候常常会发生错误,在一般的情况下,这些错误会被DNA修复酶(DNA repair enzymes)所修复。当这些错误没有被修复而在DNA中保存下来时,这种错误就被称为新的突变(de novo mutation)。

突变实际上是一种中性的概念,大部分突变对机体不会有任何影响。
重组是遗传变异中另一种重要的来源。我们每个人都拥有来自父亲和母亲的遗传资料。重组是染色体的物理交换,多发生于二倍体生物的减数分裂期。重组可以产生与亲本不同的染色体。


一、遗传变异的类型
在学习遗传变异的类型之前,我们需要先区别几个概念
突变mutation和多态性polymorphisms和变异variant
一般而言,在全球所有人群中小于1%的变异被称为突变,大于1%的称为多态性,这实际上是一种人为的界定。变异则是二者的统称。
(一) 单碱基对替换(single base-pair substitution),单核苷酸多态性(single nucleotide polymorphisms,SNPs)和单核苷酸位点变异(single nucleotide variant,SNV)
不论是SNP或是SNV都有以下两种形式:
1. 转换(transition)是指嘧啶与嘧啶,或嘌呤与嘌呤之间的替换
2. 颠换(transversions)是指嘧啶与嘌呤之间的替换
个人认为,SNP与SNV实际上是同一种遗传变异形式在不同的对象人群中的名称。
SNP,即单核苷酸/碱基多态性是一个群体概念,是指某种基因的差异在整个群体中的占比大于1%以上时,则将其称为单核苷酸多态性。这种变异大多是发生在生殖细胞上的,人基因组上平均约每1000个核苷酸即可能出现1个单核苷酸多态性的变化,其中有些单核苷酸多态性可能与疾病有关,但可能大多数与疾病无关。
SNV,即单核苷酸位点变异。例如在研究癌症基因组变异时,相对于正常组织,癌症中特异的单核苷酸变异是一种体细胞突变(somatic mutation),称做SNV。实际上,我们常说的点突变,其概念在狭义上就等同于单核苷酸位点变异。
SNV可能会导致以下几种改变:

1. Stop gain(nonsense):即无义突变,突变后变成一个终止密码子,使得多肽链的合成提前终止,肽链长度变短而成为无活性的截短蛋白。
2. Stop loss:终止密码子缺失,导致本应该终止的肽链继续延伸。
3. Non-synonymous(missense):即错义突变,改变翻译成的氨基酸类型。
4. Synonymous(silent):即同义突变,由于密码子存在简并性,虽然碱基发生改变,但是不改变翻译出来的氨基酸类型。
5. Affect splicing:影响剪切。

(二)插入(insertion)与缺失(deletion),也被统称为“indel”
插入或删除单个DNA序列片段,长度范围从一个到数百个碱基对不等。

当Indel发生在基因间区或内含子区时,对基因表型没有影响。
当发生在编码区(coding regions)时,又分为以下两种方式:
1. 移码突变(frameshifting)
由非三的倍数个核苷酸的插入或删除造成,因基因表达时密码子是由三个核苷酸组成,此类插入或删除会改变阅读框架,进而使mRNA在此突变以后翻译出完全不同的蛋白质。框移突变在开放阅读框越上游的区域发生,对蛋白质的影响越大,且因框移突变可能会改变终止密码子出现的位置,也会改变翻译出蛋白质的大小,一般会使其完全失去功能。

2. 非移码突变(non-frameshifting)
非移码插入/缺失突变是指可被三整除的核苷酸的插入或缺失,mRNA的读取框不会被破坏。由此产生的突变蛋白序列与野生型不同,一般为增加或删除一个或多个氨基酸残基。

(三)结构变异(structural variation)
主要是指大段的DNA序列发生变异的情况,一般是指大于1kb的序列(随着测序技术的发展,现在定义已经被延伸到大于50bp的序列)。包括大段的缺失、插入、重复、拷贝数变异(copy number variation)和染色体重排(chromosomal rearrangement)。

二、 染色体数量异常
最常见的例子就是21三体综合征,即唐氏综合征。这里不做过多赘述。

【参考文献】
Alkan C, Coe BP, Eichler EE. Genome structural variation discovery and genotyping. Nat Rev Genet. 2011 May;12(5):363-76. doi: 10.1038/nrg2958. Epub 2011 Mar 1. PMID: 21358748; PMCID: PMC4108431.
Pagel KA, Antaki D, Lian A, Mort M, Cooper DN, Sebat J, Iakoucheva LM, Mooney SD, Radivojac P. Pathogenicity and functional impact of non-frameshifting insertion/deletion variation in the human genome. PLoS Comput Biol. 2019 Jun 14;15(6):e1007112. doi: 10.1371/journal.pcbi.1007112. PMID: 31199787; PMCID: PMC6594643.
北京大学,生物信息学导论网络课,2013.