科研代码分享|用R语言对表达谱样本做PCA分析
科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!
搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码
真香提示:文末可以知道如何获取代码~
主成分分析(Principal component analysis, PCA)是一种数学算法,它可以在减少数据维度的同时,保留数据集中绝大多数的变量[1]。
PCA通过对主成分进行辨别,找出一个方向,并沿此方向分布的数据为最大值,从而减少数据维度。通过采用这样的主成分,便可以只选用若干变量而不是上千的变量来对一种样品进行分析了。
这样,就可以将样品有关变量绘制成图,使得样品间的相似性和相异之处一目了然,对不同样品是否可以归为一组,也一清二楚。这里我们主要解析如何利用R语言,基于表达谱中基因的表达值做PCA分析,并输出三维的PCA结果图。
1. 在线安装并加载rgl包
source("http://bioconductor.org/biocLite.R")
biocLite(“rgl”)
library(rgl)
2. 输入表达谱数据(示例以一组随意获得的表达谱中的表达谱值为例)

A=read.table("e:/diff-exp-zhuan.txt",header=T)
#输入表达谱数据,注意这里基因数目一定不能少于样本数目
B=as.data.frame(scale(A[2:21]))
#指定参与做PCA分析的数据
3. 用之前指定的数据做PCA分析
pca <- prcomp(B)
summary(pca)
结果:将组成成分的信息均展示出:

4. 画出前三个PC为轴的PCA三维图(此处可根据研究目的等需求来选取需要的PC来指定根据哪三个PC来画图)
colour<-c(rep("gray",10),rep("orange",10))
plot3d(pca$x[,1:3],col=colour,type="s",radius=0.35,font.lab=2)

此图在R上画出后,可以根据最后输出图形的角度,用单击鼠标左键的方式在页面上进行旋转,得到不同视觉角度的图。
这样,根据输入的基因的表达值的PCA分析与PCA立体结果图就完成了,很简单吧?赶快试试。
搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码