「青莲聚焦」HBFP数据库助力人类体液蛋白质组研究
「青莲聚焦」HBFP数据库助力人类体液蛋白质组研究
人体体液被认为是疾病相关蛋白的重要来源,这些蛋白从全身的病理组织中分泌或泄漏,其中许多通常可以通过非侵入性方法获得。体液蛋白质组作为疾病生物标志物发现的主要来源已被深入研究。在创新的高通量技术的支持下,现代蛋白质组学研究已成功鉴定了血浆、血清、唾液和尿液等各种体液中的大量蛋白质。
吉林大学教育部符号计算与知识工程重点实验室开发了一个新的人体体液蛋白质组 (HBFP) 数据库,该数据库侧重于17种人体体液中经过实验验证的蛋白质组,当前数据库归档了 164 份文献报道的 11827 种独特蛋白质,自 2001 年以来,肽和蛋白质水平的最大错误发现率为 0.01,并且用户能够查询、分析和下载每种体液的蛋白质条目。

图1:人体体液蛋白质组数据库(HBFP)在线网站
链接:https://bmbl.bmi.osumc.edu/HBFP/
查询页面允许用户根据不同类型输入(包括蛋白质ID、基因名称、蛋白质或基因序列)来搜索体液蛋白质。每个蛋白条目提供了蛋白质分泌信息、文献来源、丰度、置信度和功能注释。该数据库系统还为用户提供了基于GO功能注释和KEGG通路分析的数据可视化和下载。浏览页面提供了17 种体液相关的蛋白质概述列表以及查看和下载所选蛋白质的链接。

图2:HBFP查询页面的构建流程和实用程序
HBFP数据库中的许多蛋白质在体液类型方面分布广泛,对不同体液的比较分析可以提供关于拟议标记蛋白特异性的进一步信息。已鉴定的11827种蛋白质中,66.8%在至少两种体液中被鉴定出来,93种蛋白质(0.79%)在所有分析的体液中均鉴定到,这可能表明这些蛋白质对各种生命活动是必不可少的。

图3:不同体液的比较分析
为了仔细观察这个比较,作者关注了五种蛋白质数量最高的体液包括血液、尿液、CSF、SF 、BALF。一个有趣的发现是尿液与其他体液共享大量常见蛋白质。并对共同含有的965 种蛋白质进行GO分析。

图4:五种体液蛋白质组的Venn图及共有蛋白质的GO注释
HBFP数据库所有数据均可通过一个开放访问的用户友好型网络平台获得。所有蛋白质条目都是手动管理的,可以很容易地追溯到原始文献。用户可以查询和下载感兴趣的蛋白质以验证自己研究中的发现或对人类分泌组进行生信分析。作为人类蛋白质分泌组的重要资源,这个新的HBFP数据库可以成为促进临床蛋白质组学研究和生物标志物发现的有力工具。 参考文献:Shao Dan,Huang Lan,Wang Yan et al. HBFP: a new repository for human body fluid proteome.[J] .Database (Oxford), 2021, 2021: undefined.
青莲百奥可提供一站式蛋白质组学、代谢组学、转录组学、多组学联合分析等科研服务。青莲百奥在生物活性肽检测项目经验丰富,界内最全的Bioactive Database、NeuroPedia Database,专业分析软件Peaks,海归坐镇生信分析团队,助您在科研道路上乘风破浪,冲击高水平文章。
更多技术服务敬请来电咨询
010-53395839