欢迎光临散文网 会员登陆 & 注册

癌症跟基因有关吗

2022-11-22 13:32 作者:FLOWHUB  | 我要投稿

癌症是一种基因组疾病:如果我们将癌细胞的基因组与标准人类参考基因组进行比较,我们会发现它经常在多个位点发生改变。幸运的是,并非所有这些基因改变都是危险的或致病的。自出生以来,其中许多也存在于我们身体的所有其他细胞中:这些被称为种系突变,是从我们的父母那里遗传的,是使每个人独一无二的原因。但是在特定组织中还有其他改变,通常是DNA复制错误或暴露于诱变因素的结果,这些被称为体细胞突变。

在大多数情况下,这些突变并不危险。尽管如此,在某些情况下,它们可能会导致细胞表型的改变,例如细胞以异常方式生长,如良性息肉的情况。积累基因组改变的细胞,通常是由于暴露于环境影响(例如过度晒黑)或由于不良生活习惯(如肥胖或吸烟)的影响,会增加其发展异常表型的可能性,从而导致致癌。与良性息肉不同,癌细胞可以侵入周围组织,甚至迁移到身体的其他部位。平均而言,一个肿瘤细胞在其DNA上积累了1000到10,000个体细胞突变,但其中只有一部分是导致癌变表型发展的真正“驱动因素”。

一些体细胞突变的存在只是因为肿瘤细胞的基因组不是很稳定:在某些情况下,每个肿瘤细胞都可以产生一些特定的突变并将它们传递给它们的后代,从而产生遗传异质的肿瘤块。在其他情况下,肿瘤的所有细胞共享大致相同的突变,如克隆肿瘤的情况。有时,获得性突变使肿瘤具有侵入其他组织的能力,进入血液或淋巴系统并侵入远处的组织,这就是我们所说的转移。

癌症基因组学研究肿瘤细胞和正常细胞之间DNA序列的差异:通过基因组测序,我们可以识别这些基因组改变,从而表征肿瘤以了解它们对治疗的敏感性并预测它们的预后。癌症基因组学代表了肿瘤学的强大工具,但我们必须了解一些技术参数,才能正确设计和执行癌症基因组测序。在正确准备好生物标本之后,下一代测序仪可以生成我们称之为“测序读数”的DNA序列片段。在一组测序读数中表示基因组参考碱基的次数称为测序覆盖率。为了正确识别肿瘤细胞DNA中发生了哪些基因组变化,我们需要具有良好的测序覆盖率,以便能够区分真正的基因组变化和测序错误,并识别低频突变。因此,一般来说,如果你想对更大的基因组部分进行测序,你将获得更多的数据,分析的复杂性和成本也会更高。

根据我们的需要,为了测量基因组改变,我们可以在不同的测序目标之间进行选择。我们可以选择靶向测序,别名基因组,这使我们能够自信地检测特定基因数量的改变。全外显子组测序——用于筛选编码区域,约占基因组的1-2%。或者,如果我们想要完整的图片,我们可以选择全基因组测序来访问整个基因组,包括非编码区域,如调控区域、假基因和单倍型。基因组可以对选定的疾病特异性基因进行非常高的覆盖,因此广泛用于诊断环境,因为它们能够很好地发现特定基因上深度已知的热点突变,同时减少时间、成本和数据负担。

全外显子组和全基因组测序等综合方法的好处是可以同时识别多个可能未知的突变,从而实现探索性研究和新发现,尽管成本和数据量会增加,分析时间和复杂性也会增加。它们越来越多地用于初级研究和早期临床试验,以探索各种癌症类型的基因组景观和分子机制,以及表征驱动癌症进展的突变。不同的测序目标需要不同数量和质量的输入DNA样本来执行文库准备步骤。一般来说,最好的基因组测序质量来自大量细胞和新鲜冷冻或新鲜组织样本,而不是福尔马林固定石蜡包埋样本。通常,基因组不需要大量的gDNA。根据我们设施的经验,大约10-100ng,具体取决于试剂盒类型,通常与低质量样品兼容,例如从福尔马林固定石蜡包埋组织中提取的DNA。另一方面,对于全外显子组测序和全基因组测序,通常建议最少使用50nggDNA。有针对从福尔马林固定石蜡包埋样本中提取的DNA而优化的全外显子组测序和全基因组测序文库制备方案。尽管如此,由于福尔马林固定引起的测序伪影,这些工作流程仍然具有挑战性,主要是在回顾性系列中从储存的标本中提取DNA时。

设计实验时要考虑的另一个关键点是需要对照样本:当您对癌症样本进行分析时,至关重要的是要有一个匹配的正常样本,以确定与肿瘤细胞相关的真实基因组变异,排除遗传性种系改变.通常用作正常DNA来源的对照样本是血液、口腔拭子或肿瘤周围的正常组织,在最后一种情况下,我们必须确保组织的微环境没有改变。现在让我们谈谈与肿瘤样本分析相关的一些潜在问题:肿瘤纯度和瘤内异质性。

一般来说,从临床实践中获得的实体瘤组织具有高度异质性。它们可以是癌症亚克隆、周围正常组织、基质和浸润性免疫细胞的混合物。估计肿瘤纯度,即这些异质样本中癌细胞的比例,是至关重要的,因为肿瘤组织中正常细胞的污染会在基因组分析中引入噪声,从而减少变得更难以检测的肿瘤改变信号。此外,通常在同一肿瘤块内,可能存在不止一个肿瘤细胞群。

即使突变只出现在一小部分细胞中,如果它赋予肿瘤选择性优势,也可能导致耐药或复发。由于对大量DNA中低代表DNA物种进行测序的实际概率与测序深度成正比,因此检测小亚克隆中存在的突变所需的平均覆盖率需要更高。克服这些挑战的一种有效方法是在单细胞水平上研究实体瘤样本,以识别和表征细胞亚群。

测序后,过滤掉低质量的读数,并将剩余的读数映射到参考基因组。在此阶段,必须确定测序的效率。这可以通过检查测序覆盖率来完成。质量指标通常如下所示第一个数字表示平均覆盖率,表明在这种情况下,每个碱基平均被测序100次。作为所有已测序基因组的平均值,该数字并未提供有关测序效率较低区域的任何信息。因此,提供有关目标基因组覆盖率的均匀程度或有多少碱基具有零覆盖率或低覆盖率的衡量标准很有用。在这种情况下,质量度量告诉我们90%的区域的覆盖率至少为20倍。

一旦我们确保达到了所需的覆盖率,我们就可以检测到几种不同类型的基因组变化,这些变化可以分为小变化和大变化。需要高测序覆盖率才能可靠地检测到的小改变包括:单核苷酸变异,这是一个碱基对变化的点突变,例如,如果A被C替换。或Indels,这是小插入和缺失,由两个碱基组成,最多可达几十个。通过将收集样本的基因组与匹配的正常组织或血液DNA进行比较以排除种系突变,可以检测到微小的变化。每对样本的基因组学变异都记录在一个带有VCF扩展名的文本文件中。在几个显示文件生成方式的元数据行之后,每个变体由VCF文件中的一行表示,报告几条信息,例如基因组上变异的位置。替代等位基因和该位置的参考基因组质量分数以及变异是否通过了质量过滤器。以及其他信息,例如具有这种变异的样本数量和样本的组合深度。

检测改变非常简单,但由于癌细胞携带大量突变,数据的管理和解释可能非常具有挑战性,尤其是在对整个基因组进行测序时,在这种情况下,vcf文件将包含数万行。生物信息学工具可用于将每个改变的功能信息添加到vcf文件中,例如受影响的基因和突变的潜在功能影响,例如它是否会导致移码或沉默突变。此外,为了识别致病突变并确定潜在药物靶标的优先级,可以筛选由国际肿瘤委员会更新的临床精选数据库。然而,必须牢记,过滤和注释突变是分析的关键但具有挑战性的步骤,通常需要手动策划以说明肿瘤的特异性。我们也可以进行大的改动。

事实上,肿瘤细胞的基因组不稳定性也会导致结构性染色体畸变的积累,这也可以在较低的测序覆盖率下检测到。这些大的改变包括拷贝数改变,当基因组的一部分以异常数量的拷贝(而不是两个)存在时,就会发生这种情况。这些被识别为经历一段DNA的增加或丢失的基因组部分,并且可检测为相对于正常对照的测序深度的局部变化。我们还可以进行结构重排,即基因组的一部分位于不同的位置。

我们可以在没有正常样本的情况下进行类似的分析吗?如果没有匹配的正常样本来过滤掉种系突变,每个人参考基因组的变异数量可能会非常高,大约有70-10万个变异。在这种情况下,我们可以使用来自大量健康个体的信息过滤至少一部分,丢弃最具多态性的位点。然而,应谨慎使用这种方法,因为在人群中经常发生突变的基因中发现了众所周知的癌症驱动基因改变,并且会被这种方法丢弃。由于癌症基因组学计划的努力,例如癌症基因组图谱(TCGA),其中包括33种癌症类型的10,000多名患者的临床、基因组和转录组学信息,许多先前发布的关于癌症基因组学的数据可以被使用和查询。这些数据集经过协调和整理,因此非常适合与您的数据进行比较。

让我们通过与Ospedale SanRaffaele组学科学中心的AnnaSofia交谈来总结我们所学到的知识。癌症基因组学研究肿瘤细胞和正常细胞之间的DNA差异,这些差异可以通过基因组测序检测到。根据我们的问题,我们可以选择不同的测序目标:疾病特异性基因、所有编码区或所有基因组。

我们已经看到,不同的测序目标需要不同数量和质量的输入DNA,并且具有不同的时间、成本和数据负担。癌症基因组学分析的关键方面是:需要对照样本,以区分体细胞改变和种系改变。良好的覆盖范围,自信地检测罕见的变化估计样品的纯度,以滤除因非癌性细胞类型的存在而引入的噪音。我们可以通过生物信息学分析检测到的DNA差异是小的改变,如SNP和插入缺失,或大的改变,如CNV和结构重排。请记住,检测变化非常简单,但对结果的解释仍然非常具有挑战性,并且需要对不同肿瘤类型有深入的了解。

癌症跟基因有关吗的评论 (共 条)

分享到微博请遵守国家法律