R语言如何绘制PCA图(3)
1.什么是PCA?
人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。
主成分分析法,也被称为主分量分析法,是很常用的一种数据降维方法。主成分分析法采用一个线性变换将数据变换到一个新的坐标系统,使得任何数据点投影到第一个坐标(第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,以此类推。因此,主成分分析可以减少数据的维数,并保留对方差贡献最大的特征。
本文我们就来讨论一下PCA图是如何绘制的以及如何对其进行解读。

2.绘图前的数据准备
demo数据可以在https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/PCA/PCA.rar下载。
2.1 PCA数据
数据来源一般是搜库结果定量表。包含2个维度的数据,一般情况下,每一行是一个基因,每一列是一个样本。
2.2 分组数据(可选)
行名的名称和个数要和之前的PCA数据保持一致,列名为分组名称,可以包含不止一个分组。

3. R语言怎么画PCA
4.BioLadder生信云平台在线绘制PCA图
不想写代码?可以用BioLadder生信云平台在线绘制热图。
免费使用,注册登录后畅享40+模块。
网址:https://www.bioladder.cn/web/#/chart/13
4.1 上传文件
点击“选择”按钮上传自己的文件
备注:
第2文件为分组信息,非必选;
点击查看按钮可以查看自己的上传的数据;
点击下载示例,可以下载demo数据;
支持txt,csv,xlsx,xls四种格式;

4.2 调整参数
4.2.1 PCA特有参数
根据需求调整参数即可
按分组画图:勾选后按照样本名称进行绘制,否则按照基因进行绘制
是否画椭圆:是否围绕分组画个椭圆(当分组内重复《=2时,不能画椭圆)
label字体大小:调整标记文字的大小

4.2.2 通用参数
坐标轴选项卡:可以调整坐标轴名字,刻度大小,方向,图例位置大小等

颜色选项卡:可以调整图案颜色和透明度,以及可以选择画板背景主题。

4.3 提交查看
上传完数据,并调好参数后,点击右上方“提交”按钮,图像会出现在左侧。如果没有上传自己的数据,会使用默认的demo数据绘图。

4.4 下载
可以直接点击下载按钮,快捷下载当前所看到的图形。也可以点击更多选项,对图片的宽高,格式等做调整。

更多选项里,可以手动拖拽调整图片大小,也可以在下方的输入框内直接输入想要的大小,支持下载PNG,PDF,SVG,JPEG,BMP,EPS,TIFF等多种格式。

5.PCA结果解读
是主成分分析的PC1和PC2的结果,横纵坐标分别为前两个主成分,括号内的百分比为该主成分能解释的变量的百分比。PCA得分图能将对照组和实验组样本区分开。在PCA图中,如果样本之间聚集在一起,说明这些样本差异性小;反之样本之间距离越远,说明样本之间差异性越大。不同颜色的散点表示不同实验分组的样本。
6.BioLadder生物信息在线分析可视化云平台
网址:https://www.bioladder.cn/
BioLadder目前上线了生物学分析最常用50多个模块,主要包括以下四类:
数据可视化:箱线图,南丁格尔玫瑰图,韦恩图,UpSet图,饼图,词云图,核密度图,小提琴图,弦图,柱形图等
组学数据分析:序列的多重比对,表达数据的CV曲线图,PCA,T-SNE,热图,相关性热图等,趋势分析的mFuzz,差异分析的火山图,富集分析的气泡图,修饰位点上下游模体分析的seqLogo,Motif热图等
功能分析:GO弦图,相互作用网络图,富集分析
数据预处理:归一化,补值,FDR校正,长宽表互换等