【普鲸甲基化小讲堂】第10讲 - EPIC初探(1)
前面我们讲过,Illumina最早是以制造基因芯片起家的,后来收购了Solexa公司后才步入了NGS领域,直至今天成长为一家综合性的生物技术公司。
Illumina的基因芯片技术我们通常称之为“微珠”芯片,因为它的原理形象一点说就是把芯片探针合成在一个个小的微珠上面,然后芯片本身就像一块坑坑洼洼的平板,最后把一堆小小的微珠洒在平板上,就做成了一张张芯片了。当然这是很不严谨的比喻,但是能让我们很好地了解Illumina芯片的特点,因为这个特点,它有一个独特的名字叫做Infinium BeadChip。
而Illumina采用这款技术最早涉及到了使用芯片直接进行甲基化检测领域,它不依赖于ChIP等实验,而是采用亚硫酸氢盐转化,最后转化完成的DNA直接进行芯片杂交,获取探针信息。
最早推出的产品有27,000多个甲基化检测位点,所以芯片就被称为27k芯片,后来升级到了450k,而现在我们今天要介绍的它的第三代也是最新一代的产品则可以检测超过850,000个甲基化位点,所以我们习惯性地称呼它为“850k”芯片。而实际上它的官方名称叫做Illumina Infinium MethylationEPIC BeadChip。

这款芯片于2015年年底推出,至今也已经五岁多了,在甲基化芯片检测领域是当之无愧的No.1。它的设计主要是围绕着CpG岛来进行的,但同时也兼顾了一些散在的CpG位点及CpG岛周围区域,Illumina根据“岛”这个概念提出了几个延伸出来的定义:Shore、Shelf和Open Sea。

所谓的Shore就是指CpG岛周围2,000bp的区域,而Shelf则是在Shore周围2,000bp的区域,它们根据与CpG岛的相对位置还可以进一步有North和South的区分。除了CpG岛及岛周围的Shore和Shelf以外的其它所有DNA序列都被称为Open Sea。
我们很多小伙伴应该做过Illumina家的甲基化芯片了吧?如果没有做过,也可以从TCGA或者GEO等数据库下载到它的数据。注意芯片扫描出来的原始数据图像是以“.idat”为后缀的格式的哦。
拿到数据以后,我们喜欢动手的同学们就可以自己去分析它了,在R语言的BioConductor包仓库中就有很多可以用来分析Illumina甲基化芯片数据的包,常见的有ChAMP、minfi等,它们的基本处理流程都遵循芯片的处理流程一般就是:数据读入——数据过滤——数据校正——下游分析。

而有时我们处理数据或者查看已经分析好的结果的时候,还会纳闷怎么会显示有两类探针?这其实是Illumina针对甲基化检测的一种独特的技术。对于甲基化位点,Illumina同时采用了两组策略来集成在一张芯片上进行检测。

策略1:分别设计两条探针来检测同一位置的甲基化/非甲基化情况,每条探针释放的荧光信号均不相同。
策略2:用一条探针在甲基化/非甲基化情况下释放出不同的荧光信号。
这样,结合两种策略进行互补,我们就可以对甲基化谱进行一个全面的检测了,而不会发生大的疏漏。
