oebiotech云平台表达量计算详细教程
背景知识介绍
基因表达量常见的衡量指标有:FPKM、TPM、RPKM。
FPKM:Fragments Per Kilobase Million或者Fragments Per Kilobase Per Million Reads。
即每一百万条Reads中,比对到该基因的1000个base的fragments总数。
F1表示mapping到该基因的fragments总数
L1表示该基因长度
FT表示mapping到参考基因组的总fragments数
RPKM:Reads Per Kilobase Million或者Reads Per Kilobase Per Million Reads,即每一百万条Reads中,比对到该基因1000个base的Reads数。
R1 表示mapping到该基因的reads总数
L1表示该基因长度
RT表示mapping到基因组的总reads数
FPKM意义与RPKM的区别仅在于,Fragment 与 Read。
RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。
Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。
TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)。
R1表示mapping到该基因的Transcripts总数
L1表示该基因长度
Rtotal表示矫正后的所有基因的counts总和。
计算TPM分为3步:
step1:根据基因/转录本长度校正count值;假设某基因count值为R1,则校正后count值为:R1/(L1/1000),L1为该基因的长度;
step2:计算total 校正后count值;即所有基因的校正后count值总和,Rtotal;
step3:根据公式计算TPM;
欧易云平台-表达量计算
2.1 表达量计算小工具用于将转录组的counts数据转换成FPKM或者TPM标准化的数据。
参考右侧的使用说明,正确整理数据格式即可实现数据转换。
注:表头含义,第一列列名为id,第2-n列为样本名称,没有的填写为0,这里不允许不填,不填写会报错。
2.2页面参数选择
将整理完的表格,上传至表达量矩阵表位置
进行转换之前要先选择物种,选择的物种要与研究的目标物种一致,不同物种所选择的基因的长度是不一样的,这里要特别注意,如果选错物种则计算出的结果是错的。
2.3 标准化方法的选择:
主要有两种方法FPKM和TPM,适用于当前欧易转录组报告数据标准化方法。
2.4 结果展示:
点击结果下载,自动下载标准化后的数据。
猜你想看
1、科研轻而“易”举——欧易生物云平台焕新归来!
2、探"云"指南 | 欧易云ROC分析曲线
3、技术指南 | CUT&Tag技术大放送,Q&A助力了解详情
4、免疫研究工具天花板—IOBR包说明书来啦~
原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。