知乎用户 | 生信小白如何半年内收到核心期刊录用证明顺利毕业!!!
逛「知乎」看到了一个「TBtools」用户(ID:李四光)发表的系列博文,感觉不错,问询后,转载于此。一共数篇,将会逐个刊出。尽管我个人并不鼓励家族分析用于发表论文,但不代表做家族分析不能给我们带来新的知识,感兴趣的可以翻一下「生信药丸」的历史推文,希望能更详细表述我的个人观点。本篇推文,希望对其他朋友有用。 - CJ
本人农林院校的专硕研究生,学制2.5年,毕业要求是一篇核心及以上或者专利。硕士期间课题换了两次,实验数据不能支持发一篇研究论文,前期大量时间荒废没有知识储备写出综述,结合课题只能做一个物种的生信分析,保证毕业。当我知道这篇文章是我的“救命稻草”后,就开始疯狂问同学,找公众号,去b站……2021年5月22日学习了陈程杰老师的基因家族分析讲演,2021年8月24日完成论文的初稿,2021年11月29日收到投稿杂志的录用证明。


图中是用到的大部分软件和网站,使用最多的是TBtools也就是陈老师开发的强大的生物信息学分析工具(包括序列的提取,引物设计,基因结构保守域的可视化……总之功能很多,只有你不会用,而且软件一直在更新,免费的,大家可以自行搜索“生信药丸”公众号,使用讲解的很全面,保姆级别了);
其余一些使用频率不是那么高的,VMD是蛋白三级结构模型预测的可视化软件,细节很足,可以自行探索;
figtree和网站iTOL都是进化树的可视化,因为本人的基因家族成员接近400左右,实在很大,图片如果要清楚美观选择了后者,figtree应该也可以,但是本人未能摸透就放弃了;
Jalview可以进行多序列的比对,对于其中的一些氨基酸位点可以根据需要用不同颜色进行高亮显示;
MEGA可以序列比对再生成进化树,如果选择其他美化修饰软件,也是需要MEGA氨基酸序列比对后保存相关文件(.meg/.mtxs)导入才可。
当然,还有其他的许多软件和网站,根据分析的需求进行选择和组合都是没有问题的。
本人的基因家族分析大体包括三个部分:
1) 基因家族成员的鉴定
2) 基本理化性质的分析
3) 家族成员进化分析。
其中,基因家族成员的鉴定最为重要,也是反反复复比对后才确认。
首先,基因家族成员的鉴定包括:
研究的基因家族家族成员的基本特征确定
参考已有物种,我研究的是栽培花生,参考的是模式植物拟南芥,拟南芥二倍体植物,2n=10,该基因家族成员有100个左右,花生异源四倍体作物,2n=40,预估200以上,400左右)
目标物种序列和注释信息的下载(花生和拟南芥的基因组文件,基因组注释文件,共4个文件)
双向Blast比对获取可能的成员(TBtools软件进行提取后,上传序列至ncbi batch cdd/pfam/hmmer基于保守结构域进一步筛选)。
其次,是基因家族成员的基本分析包括
成员理化性质分析(分子量,等电点,亲/疏水性,有无信号肽/跨膜结构域和亚细胞定位。可以做成表格,其他分析大都是图片的形式)
基因染色体分布情况(成员在染色体上的分布做成图,每条染色体上基因成员的数量也可以统计做图)
基因结构分析(外显子内含子分布及数量)和保守结构域分析(与确定家族成员重复,可视化更为直观,如果家族基因数量不多可以把两张图合并)。
最后,基因家族成员的进化分析,包括
进化树构建与可视化(本人研究基因家族成员较大,亚家族分类与参考(拟南芥)/已知(水稻、小麦、葡萄和栎树)物种较为一致,暗示结果具有一定可靠性)
物种内的共线性分析(可以看基因是否存在串联重复)
不同物种之间的共线性分析(研究种间基因组同源性程度,抄过来的,通俗的理解是目标物种为A,现在做了ABC三个物种的共线性,其中AB共线性数量多于AC,说明A和B的亲缘关系更近)。
当然,以上内容仅为最基础的部分,其他更深入全面的分析如启动子的预测,三级结构模型的预测,部分实验qRT-PCR等等。
如果你想发一篇好文章,这远远是不够的,只能说越早开始越好。以上是内容大概,后期发布详细分析过程。

本文使用 文章同步助手 同步