欢迎光临散文网 会员登陆 & 注册

科研代码大全|小云课堂之python简单处理fasta序列

2023-06-20 16:31 作者:尔云间  | 我要投稿


大家好,本期小云将向大家介绍简单使用python处理fasta序列,接下来跟着小云一起来学习一下吧!

1. 认识fasta序列

Fasta序列包含两行,分别为id和序列,如下图。给了四条fasta序列,小云会将这四条数据放在一个名为case格式为.txt的文件中,然后打包给大家练手

2.如何导入数据,并统计序列总数

找到数据存放位置,得到其绝对路径:单击文件右键,点击属性即可得到。比如case在小云电脑的绝对路径如下:C:/Users/Admin/Desktop/case.txt

然后使用代码将数据读入,并进行处理:

该代码可以统计总共有多少条序列。

首先是:

打开文件

然后是

将文件case所有内容读入并存放在t中

初始化一个数值为零的变量count用于计数

For循环的作用是是对存放在文件句柄t的数据进行逐行编列,然后使用if语句判断是否含有“>”大于符号,含有该符号,则count数值加一,遍历完数据后,序列总数将存放在变量count中。接着使用

关闭文件句柄

最后使用

打印出总共有多少条序列。

3. 小云教大家怎么随机抽出指定数目的fasta序列,这里定义了一个randomselect函数

只需要改变你想要的序列条数,主函数的文件的路径即可实现。

 以上就是本期的内容啦,我们下期再见!这里小云还想推荐一个小工具:单细胞数据绘制小提琴图(http://www.biocloudservice.com/788/788.php),在线运行,可以使用加载的数据来实践哦。




科研代码大全|小云课堂之python简单处理fasta序列的评论 (共 条)

分享到微博请遵守国家法律