欢迎光临散文网 会员登陆 & 注册

【菜鸟博士学习】【ProteoWizard MSConvert】质谱文件格式简介及其转换

2022-01-14 17:21 作者:菜鸟博士_杂货铺  | 我要投稿

【菜鸟博士学习】【ProteoWizard MSConvert】质谱文件格式简介及其转换


菜鸟博士Caesar


分享快乐

【ProteoWizard MSConvert】质谱文件格式简介及其转换

质谱格式

质谱文件格式多种多样,各仪器厂商产出的数据都有不同。虽然HUPO已经对质谱数据进行了标准化,但大家依然是我行我素,因为不得不用它们提供的软件,而不同的软件会要求不同的格式进行搜库(不过现在很多软件以及支持多种数据格式了,如MaxQuant)。各厂商对应的文件格式如下表:




image.png

好在ProteoWizard为我们提供了格式转换的工具MSConvert,它可以转换为以下数据格式:

  • mzML 1.1

  • mzML 1.0

  • mzXML

  • MGF

  • MS2/CMS2/BMS2

  • mzIdentML
    其中mzXML和mzML就是标准数据格式。

格式转换

MSConvert的Linux版本并不友好,需要wine/docker来运行Proteowizard,但一般linux默认都是x64架构,而x64一直诟病于对Framework的支持。

1.Linux转换

Wine

msconvert –help

msconvert data.RAW –mzXML #默认mzML

msconvert *.RAW -o my_output_dir

msconvert data.RAW –zlib –filter “peakPicking true [1,2]” #用vendor方法对msLevels 1/2进行中心化过滤,并用zlib对结果数据进行压缩,此命令比较常用

更多命令可参考:msconvert

Docker
ProteoWizard提供了docker解决方案

# 下载docker镜像

docker pull chambm/pwiz-skyline-i-agree-to-the-vendor-licenses


##直接运行

docker run -it --rm -e WINEDEBUG=-all -v /home/xxx/rawfiles/:/data chambm/pwiz-skyline-i-agree-to-the-vendor-licenses wine msconvert /data/*.raw --filter "peakPicking true 1-"


## 交互式运行,通过bash进入

docker run -it --rm -e WINEDEBUG=-all -v /home/xxx/rawfiles/:/data chambm/pwiz-skyline-i-agree-to-the-vendor-licenses /bin/bash

转换过程会遇到一些错误,好像都有一些问题。

2.Windows转换

GUI界面版本操作起来更简单,但数据转移和运行速度实在是忍不了。



使用默认参数不过滤的话,转换的文件会非常大(比源文件增加数倍,因为它把一些无强度的峰也加进去了),速度也巨慢。一般Filters需要设置为Peak Picking,MS Levels设为1-2。



而且要注意,选择后记得按Add,否则还是没有加入peakPicking,并且要将peakPicking放在第一行(行可拖动)。




其他格式转换软件

  • ThermoRawFileParser

  • Proteome Discoverer

  • GNPS
    不同软件转换的结果很可能不同。比如同一个数据,我用ThermoRawFileParser(默认参数),同事用Proteome Discoverer,得到MGF的谱图数竟然有4-5倍差异!后来用MSConvert转换和ThermoRawFileParser谱图一致,它俩的算法好像是一样的。哎,搞不懂,如果连原始数据质量都不能保证,还做个屁的数据分析。


【菜鸟博士学习】【ProteoWizard MSConvert】质谱文件格式简介及其转换的评论 (共 条)

分享到微博请遵守国家法律