生信学习之monocle的安装与对单细胞数据的质控
尔云间 一个专门做科研的团队
欢迎点赞+收藏+关注

今天小果带大家一起来认识单细胞测序的另一个常用工具Monocle,那就和我一起往下学习吧!~~
什么是Monocle?

在学习一个工具之前,我们首先要大概了解这个工具的基本来源和用途哦,这是每一个生信人都要养成的良好习惯!那就和小果一起来看看到底什么是Monocle吧!其实,Monocle包可以根据每个细胞在学习轨迹上的进展对其进行排序,这一功能我们可以联想一些排序算法、排序工具等等哦。但是!要注意的是Monocle不是跟踪表达式随时间变化的函数,而是跟踪沿轨迹变化的函数,这样的变化表面看起来和时间变化有关却又不是时间,我们也就称之为伪时间,小果这样讲是不是就通俗易懂hen多了呢?
Monocle有几大功能模块?
众所周知,Monocle包也是单细胞测序中常用到的包之一。
那么Monocle可以帮助我们进行哪些方面的单细胞分析呢?和小果一起来看看吧!
1.聚类,分类,细胞计数。
2.细胞的差异表达分析。
3.构建单细胞轨迹。即在细胞发育、疾病以及整个生命过程里,细胞从一个状态转成另一个状态。
接下来,让小果带你学习如何安装Monocle包以及如何简单地使用Monocle包来对单细胞数据进行质控吧!!
Monocle包的安装
monocle包的安装有好几种方式,接下来是小果整理的三种安装monocle包的方法,快来和小编一起学习吧!~
· 通过Bioconducor安装
dyno安装
官网安装
以上三种方法,小果最推荐的还是第一种,小果在下载的时候用的也是第一种方法哦~快速简单且高效,同学们根据自身情况自行参考哈!~
Monocle对单细胞数据进行质控
安装成功后,我们和小果一起来看一下这个包的简单使用方法吧!
step1:准备需要的R包
对于我们本次学习要用的数据从哪里来呢?不要急!小果给大家准备了两个R包来帮助我们进行后续的工作!让我们一起来看一下!
本次质控分析我们使用scRNAseq中的数据作为基础数据,并用来构建后续的数据矩阵,所以也需要我们提前下载好scRNAseq数据包哦!
step2:准备数据
小果这次使用的是scRNAseq里面的示例数据fluidigm哦,同学们自行选择哦!!。虽然这个示例数据本身是一个数据对象,但我们还需从中提取出后续质控所需要的部分,再组成新的对象。简单来说,就是我们需要对数据进行“二次包装”,转为我们需要的数据格式哦~

提示信息如下:


我们可以看到,在我们创建的数据中有130个细胞,26255个基因哦。
step3:构建数据对象

step4:数据质控
哈哈,又到了小果最喜欢的数据质控环节啦!首先我们在数据质控之前一起来看一下数据过滤前的数据维度吧!
可以看到目前的数据维度是130个细胞,26255个基因。





以上分享就结束了,关注小果更多生信干货持续更新哦

生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)
往期代码:
【1】lncRNA的拷贝数变异下游相关分析
【2】R可视化:ggstatsplot包—科研界的美图秀秀
【3】随机森林算法用于分类预测和筛选诊断标志物
【4】基于本地Java版GSEA的输出结果整合多个通路到一张图
【5】基于岭回归模型和基因表达矩阵估算样本对药物反应的敏感性
【6】基于R包NMF对样本进行分型分析
【7】DALEX包用于探索、解释和评估模型;分析不同特征变量对响应变量的影响
【8】根据肿瘤突变负荷TMB进行KM生存分析寻找最佳的cutoff
【9】基于单样本富集分析算法评估组织中的免疫细胞浸润水平
【10】代码分享│什么?你还在用散点图来可视化数据之间的相关性
【11】代码分享│诊断列线图、校准曲线、决策曲线和临床影响曲线的构建
【12】代码分享│你了解基因的动态变化模式吗
【13】代码分享│生物信息分析之SCI热门图表-复杂热图
【14】代码分享│生物信息分析之SCI热门图表-火山图
【15】代码分享│生物信息分析之SCI热门图表-箱型图和小提琴图
【16】代码分享│深度学习-人工神经网络(ANN)的构建
【17】代码分享│R可视化:高分文章绘图之基于RCircos包的多类型圈图绘制
【18】代码分享│R可视化:基因与功能之间的关系--GO功能富集网络图绘制
【19】代码分享│生物信息分析之SCI热门图表—KM曲线和tROC曲线
【20】代码分享│R可视化:肿瘤预后模型之Cox回归分析后用R语言绘制森林图
【21】代码分享│生物信息分析之SCI热门图表—相关性热图和散点图
【22】代码分享│生信分析之R语言分析相关性及可视化的N种风格
【23】代码分享│TCGA数据获取有困难,不会预处理,学习起来
【24】代码分享│机器学习-支持向量机递归特征消除(SVM-RFE)的构建
【25】代码分享│R可视化:对两个矩阵进行相关性可视化分析
【26】GEO数据库多数据集差异分析整合利器RRA,再也不用纠结去除批次效应
【27】你与生信大佬的距离,只差2分钟搞定预后模型构建和性能评估
【28】9+SCI纯生信,模型构建中的“流量明星”,你不得不知的LASSO
【29】手把手教你画美观大气的lasso回归模型图,为你的SCI增砖添瓦
【30】R可视化:clusterProfiler包做组间比较GO富集图
【31】代码分享|R可视化:复杂热图绘制技巧之热图中添加柱状图
【32】代码分享——基于基因突变信息分析肿瘤突变负荷
【33】代码分享│富集不到想要的通路?别放弃呀,试试GSEA
【34】代码分享│还在用PCA做降维聚类吗?最强降维模型tSNE--你值得拥有
【35】代码分享│GSVA:原来功能通路也能做差异分析!
【36】代码分享│Slingshot:你不知道的单细胞拟时序分析还有它
【37】基于基因功能注释信息挖掘关键作用基因
【38】基于癌症分类预测的标志物特征提取的SVM-RFE分析代码
【39】依据表型数据基于无监督聚类算法对研究群体进行分层聚类分析
【40】基于稳健排序整合算法对多数据集进行整合及可视化
【41】基于基因表达谱估算样本免疫基质评分和肿瘤纯度
【42】自动化绘制LASSO算法回归模型图
【43】用于临床诊断和临床决策影响的DCA分析
【44】基于样本预后生存信息和临床因素用于评价不同模型的一致性指数软件
【45】用于探索、解释和评估模型的DALEX残差分析软件
【46】基于细菌群落功能丰度结果进行差异功能分析及可视化
【47】基于基因差异分析结果绘制其在染色体上的分布
【48】利用逐步回归法筛选特征基因构建Cox风险模型分析
【49】基于Immune Subtype Classifier进行肿瘤免疫亚型分类
【50】不同物种之间的同源基因名称转换分析
【51】基于逐步多因素cox回归筛选预后标记基因并构建风险评分模型
【52】基于表达信息挖掘与关注基因密切相关的基因
【53】基因组学基因名称修正分析
【54】基于Spearman算法构建关联网络
【55】基于线性建模方法对代谢组和转录组数据整合分析
【56】基于lasso回归模型方法筛选特征基因
【57】基于线性建模方法对代谢组和转录组数据整合分析
【58】基于参数型经验贝叶斯算法和支持向量机(SVM)筛选疾病亚型特征基因
【59】基于LDA(线性判别分析)算法的微生物biomarker的筛选
【60】基于R包xCell计算64种免疫细胞相对含量及下游可视化
【61】基于甲基化数据评估肿瘤纯度及下游可视化
【62】基于DiffCorr包识别不同表型下的差异共表达关系对
【63】基于逆累计分布函数识别显著偏差通路
【64】基于差异基因对通路的影响挖掘关键通路
【65】基于高通量数据的样本相似性分析
需要以上代码,私信小编哦!

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。