10X单细胞转录组测序—常规流程
文章中其中用到的文件获取方式https://pan.baidu.com/s/1HCsHRXNX9Il8u8RIPXSEug?pwd=2626
1.上游分析
1.1 安装conda、sratoolkit、cellranger
1.2 使用conda进行常用软件安装
1.3 参考基因组下载
1.4 文件夹创建
1.5 数据下载
1.6 SRA转fastq
1.7 cellranger count流程
1.8 结果解读
web_summary.html:必看,官方说明 summary HTML file ,包括许多QC指标,预估细胞数,比对率等;
metrics_summary.csv:CSV格式数据摘要,可以不看;
possorted_genome_bam.bam:比对文件,用于可视化比对的reads和重新创建
FASTQ
文件,可以不看;possorted_genome_bam.bam.bai:索引文件;
filtered_gene_bc_matrices:是重要的一个目录,下面又包含了 barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz,是下游Seurat、Scater、Monocle等分析的输入文件,是经过
Cell Ranger
过滤后构建矩阵所需要的所有文件;filtered_feature_bc_matrix.h5:过滤掉的barcode信息HDF5 format,可以不看;
raw_feature_bc_matrix:原始barcode信息,未过滤的可以用于构建矩阵的文件,可以不看;
raw_feature_bc_matrix.h5:原始barcode信息HDF5 format,可以不看;
analysis:数据分析目录,下面又包含聚类clustering(有graph-based & k-means)、差异分析diffexp、主成分线性降维分析pca、非线性降维tsne,因为我们自己会走Seurat流程,所以不用看;
molecule_info.h5:可用于整合多样本,使用
cellranger aggr
函数;cloupe.cloupe:官方可视化工具Loupe Cell Browser 输入文件,无代码分析的情况下使用,会代码的同学通常用不到。
将所有结果中的filtered_gene_bc_matrices文件夹保存在自己电脑output文件夹下,进行下游分析
2. 下游分析
2.1 R包安装、加载
2.2 数据读取过滤
2.3 标准化
2.4 寻找高变基因
2.5 (可选)可通过以下方法修改组织样本信息
2.6 细胞周期分析
2.7 PCA分析
2.8 非线性降维
2.9 分析各亚群的marker基因
2.10 singleR 预测亚群名称
