欢迎光临散文网 会员登陆 & 注册

[BioLadder云平台] 不编程怎么画出最常用的PCA图!

2021-12-31 13:01 作者:青莲百奥  | 我要投稿

大家好!我是BioLadder生物信息在线可视化云平台的工程师小宇,今天我来给大家分享怎样用BioLadder画出常用的PCA图

如果您反馈问题,报告Bug,提出新的需求,请直接在公众号内发留言给我哦!为感谢您对BioLadder的认可我们还有星爸爸同款收纳包相赠哦!小宇先谢谢大家喽!


人眼一般能感知的空间为二维和三维。高维数据可视化的重要目标就是将高维数据呈现于二维或三维空间中。高维数据变换就是使用降维度的方法,使用线性或非线性变换把高维数据投影到低维空间,去掉冗余属性,但同时尽可能地保留高维空间的重要信息和特征。主成分分析法,也被称为主分量分析法,是很常用的一种数据降维方法。主成分分析法采用一个线性变换将数据变换到一个新的坐标系统,使得任何数据点投影到第一个坐标(第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,以此类推。因此,主成分分析可以减少数据的维数,并保留对方差贡献最大的特征。本文我们就来讨论一下PCA图是如何绘制的以及如何对其进行解读。

用BioLadder云平台画PCA图


2.绘图前的数据准备

demo数据可以在

https://www.bioladder.cn/shiny/zyp/bioladder2/demoData/PCA/PCA.rar下载。


2.1 PCA数据 

数据来源一般是搜库结果定量表。包含2个维度的数据,一般情况下,每一行是一个基因,每一列是一个样本。


2.2 分组数据(可选)

行名的名称和个数要和之前的PCA数据保持一致,列名为分组名称,可以包含不止一个分组。


3.BioLadder生信云平台在线绘制PCA图

不想写代码?可以用BioLadder生信云平台在线绘制PCA图。

免费使用,登录后畅享50+模块

网址:https://www.bioladder.cn/web/#/chart/13


3.1 导入数据

3.1.1 上传文件

点击“选择”按钮上传自己的文件

备注:

  1. 第2文件为分组信息,非必选;

  2. 点击查看按钮可以查看自己的上传的数据;

  3. 点击下载示例,可以下载demo数据;

  4. 支持txt,csv,xlsx,xls四种格式;

3.2 调整参数

PCA特有参数

根据需求调整参数即可

• 按分组画图:勾选后按照样本名称进行绘制,否则按照基因进行绘制

• 是否画椭圆:是否围绕分组画个椭圆(当分组内重复《=2时,不能画椭圆)

• label字体大小:调整标记文字的大小

通用参数

• 坐标轴选项卡:可以调整坐标轴名字,刻度大小,方向,图例位置大小等

• 颜色选项卡:可以调整图案颜色和透明度,以及可以选择画板背景主题。


3.3 提交查看

上传完数据,并调好参数后,点击右上方“提交”按钮,图像会出现在左侧。如果没有上传自己的数据,会使用默认的demo数据绘图。

3.4 下载

首先,挑选自己想要的格式有png,jpg和pdf供选择,接着调整图片的宽,高和分辨率(注:这里的宽高比会反馈到左上的绘图区),最后点击“Download”下载按钮。

更多选项里,可以手动拖拽调整图片大小,也可以在下方的输入框内直接输入想要的大小,支持下载PNG,PDF,SVG,JPEG,BMP,EPS,TIFF等多种格式。


4. PCA结果解读


PCA是主成分分析的PC1和PC2的结果,横纵坐标分别为前两个主成分,括号内的百分比为该主成分能解释的变量的百分比。PCA得分图能将对照组和实验组样本区分开。在PCA图中,如果样本之间聚集在一起,说明这些样本差异性小;反之样本之间距离越远,说明样本之间差异性越大。不同颜色的散点表示不同实验分组的样本。

5.BioLadder云平台

网址:https://www.bioladder.cn/

BioLadder目前上线了生物学分析最常用的50多个模块,主要包括以下四类:

数据可视化:箱线图,南丁格尔玫瑰图,韦恩图,UpSet图,饼图,词云图,核密度图,小提琴图,弦图,柱形图等

组学数据分析:序列的多重比对,表达数据的CV曲线图,PCA,T-SNE,热图,相关性热图等,趋势分析的mFuzz,差异分析的火山图,富集分析的气泡图,修饰位点上下游模体分析的seqLogo,Motif热图等

功能分析GO弦图,相互作用网络图,富集分析

数据预处理:归一化,补值,FDR校正,长宽表互换等

好了PCA图的绘制就到这里了,后续大家想要了解什么内容可以给我们评论反馈,我们会根据大家的意见持续更新。我们欢迎您以任何方式提出您的优化意见,使BioLadder平台成为广大科研工作者的生物信息分析首选平台!

青莲百奥可提供一站式蛋白质组学、代谢组学、转录组学、多组学联合分析等科研服务。青莲百奥在整体实验设计方面经验丰富,界内最全的Bioactive Database、NeuroPedia Database,专业分析软件Peaks,海归坐镇生信分析团队,助您在科研道路上乘风破浪,冲击高水平文章。

更多技术服务敬请来电咨询

010-5339583959


[BioLadder云平台] 不编程怎么画出最常用的PCA图!的评论 (共 条)

分享到微博请遵守国家法律