欢迎光临散文网 会员登陆 & 注册

科研代码分享|用R语言对表达谱样本做PCA分析

2022-06-13 14:55 作者:尔云间  | 我要投稿

科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!

搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码

真香提示:文末可以知道如何获取代码~ 

主成分分析(Principal component analysis, PCA)是一种数学算法,它可以在减少数据维度的同时,保留数据集中绝大多数的变量[1]。

PCA通过对主成分进行辨别,找出一个方向,并沿此方向分布的数据为最大值,从而减少数据维度。通过采用这样的主成分,便可以只选用若干变量而不是上千的变量来对一种样品进行分析了。
这样,就可以将样品有关变量绘制成图,使得样品间的相似性和相异之处一目了然,对不同样品是否可以归为一组,也一清二楚。这里我们主要解析如何利用R语言,基于表达谱中基因的表达值做PCA分析,并输出三维的PCA结果图。

1. 在线安装并加载rgl包

source("http://bioconductor.org/biocLite.R")

biocLite(“rgl”)

library(rgl)

2. 输入表达谱数据(示例以一组随意获得的表达谱中的表达谱值为例)

A=read.table("e:/diff-exp-zhuan.txt",header=T)

#输入表达谱数据,注意这里基因数目一定不能少于样本数目B=as.data.frame(scale(A[2:21]))

#指定参与做PCA分析的数据

3. 用之前指定的数据做PCA分析

pca <- prcomp(B)

summary(pca)

结果:将组成成分的信息均展示出:

4. 画出前三个PC为轴的PCA三维图(此处可根据研究目的等需求来选取需要的PC来指定根据哪三个PC来画图)

colour<-c(rep("gray",10),rep("orange",10))

plot3d(pca$x[,1:3],col=colour,type="s",radius=0.35,font.lab=2)

此图在R上画出后,可以根据最后输出图形的角度,用单击鼠标左键的方式在页面上进行旋转,得到不同视觉角度的图。

这样,根据输入的基因的表达值的PCA分析与PCA立体结果图就完成了,很简单吧?赶快试试。

搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码






科研代码分享|用R语言对表达谱样本做PCA分析的评论 (共 条)

分享到微博请遵守国家法律