欢迎光临散文网 会员登陆 & 注册

从一团乱麻中梳理生命的乐章(使用TRANSFAC数据库查找Composite Module)

2023-11-24 16:23 作者:源资科技  | 我要投稿

遗传密码的概念表明密码子在编码蛋白质时不会重叠,所以基因的编码区域看起来像文本,单词一个接一个地出现,就像自然语言一样。随后,这个概念也在基因调控理论中占主导地位:转录起始位点(TSS)前面有“一些文本”,可以指导基因何时转录、何时不转录。然而实际情况却与此不同,在一个基因的启动子区域中可以预测出数量庞大的基序。

图注:数量众多的转录起始位点

在不同的细胞类型中,转录因子的同一个“停车位”可能被完全不同的因子占据。因此,调控代码的“词语”是重叠的,转录因子的相互作用就像一支管弦乐队演奏着一首美丽的生命交响曲。每个转录因子都充当一种独立的乐器,真正的音乐是通过转录因子的协作和分组而形成的。


图注:转录因子的协作和分组

参与同一分子遗传、生化或生理过程的功能相关基因,通常受到协调调节。这种调节依靠的是多种转录因子精确地结合到基因调控区域中的靶位点(顺式元件)。顺式元件组合为独特的基因表达模式提供了结构基础。


Composite Module(复合模块)是基因启动子和增强子中转录因子(TF)结合位点的集合,转录因子可以控制基因在不同条件下(例如不同组织、细胞类型、信号诱导、细胞周期阶段)的表达。分析Composite Module对于解析生物学意义至关重要。

那么,基因的调控在表观遗传水平上到底是如何组织的呢?从ChlP-seq数据中观察看到的表观遗传密码的组织方式是什么?基因组中的这些基序如何控制基因的活性?

举个例子,在启动子的某个区域内结合了抑制子(repressor),因此基因被沉默。当其他的因子出现并移除了抑制子后,基因就被激活。

图注:启动子区域内基因的沉默和激活

利用多组分适应度函数(Multicomponent Fitness Function),研究人员可以选择最适合此基因表达谱的启动子模型,用于分析功能相关或共表达的基因。这种方法就是基于转录因子结合位点及其配对的组成来定义启动子模型的一种新方法。

图注:将函数用于搜索Composite Module

通过geneXplain平台,用户可以利用ChIP-seq工作流程查找转录因子结合位点(TFBS)的组合。或是通过平台研究全基因组组蛋白修饰谱,例如组蛋白甲基化和组蛋白乙酰化谱。

图注:复合启动子模型(Composite Module)的得分直方图

TRANSFAC是真核转录调控DNA序列元件和转录因子数据库,已经有30多年的历史了,其数据量不仅稳步增加,利用它开发的生物信息学工具也越来越多,例如PATCH可用于分析转录因子结合位点的序列相似性,MATCH可用于识别潜在的TFBS。

欢迎填写表单联系我们获取TRANSFAC示例报告

线上讲座 | 探索TRANSFAC:解锁转录因子的秘密,引领上游调控子的精准发现


从一团乱麻中梳理生命的乐章(使用TRANSFAC数据库查找Composite Module)的评论 (共 条)

分享到微博请遵守国家法律