分享到:

转录因子结合位点预测算法的研究与应用

人类已经步入后基因组时代。随着对基因研究的不断深入,了解基因表达调控机制特别是转录调控机制的需求就显得尤为迫切起来。这是因为,基因是细胞生命活动的基础。在同一生物体内,每个细胞都有一套完全相同的基因组。但是在不同的条件下,基因的表达水平不尽相同,这种行为限定了细胞中的RNA组成,进而影响到最终所能产生出的全部蛋白质,从而决定了该细胞的功能。转录过程既是DNA翻译成蛋白质的关键一步,同时也是调控基因表达的关键阶段。转录调控通常是在转录起始步骤实现的。除了启动子以外,在几乎所有基因的上游区域中都还存在着激活基因所需的一段特定的DNA序列(转录因子结合位点)。这些序列本身并不执行任何功能,只有当其被调控蛋白(转录因子)识别、结合后才能发挥作用。它们共同控制着基因的转录。转录因子与其结合位点的结合具有高度的专一性。研究转录因子就是研究转录调控的分子机制,研究一类特定的蛋白质分子与DNA序列的结合特性,研究与DNA结合的蛋白质是如何调控基  (本文共151页) 本文目录 | 阅读全文>>

吉林大学
吉林大学

基于Gibbs Sampling算法的转录因子结合位点预测研究与实现

本文主要研究基于马尔可夫链-蒙特卡罗(MCMC)理论的转录因子结合位点预测算法及其相关软件的应用。具体内容包括:研究MCMC理论及其中重要算法Gibbs sampling的具体理论与实现。在Linux操作系统下通过使用Qt(一个非常优秀的基于C++语言的跨平台的图形用户界面开发工具)对转录因子结合位点预测工具包——BEST进行应用及分析。本文首先就马尔可夫链-蒙特卡罗理论的发展现状作简要阐述,提出本课题研究的意义。然后对预测共同的转录因子结合位点的数学模型及模型采用的算法进行概述,在其中详细介绍了Gibbs sampling算法。接下来介绍了结合位点预测工具包的使用。最后,对基于Gibbssampling的生命探索者软件的基本原理及实现进行讲解,包括:基本原理,使用的数学模型和算法及具体的应用。提出了生命探索者软件的改进方向,考虑结合神经网络等智能算法,进一步改善预测软件的预测准确性,并提高软件的适应性。  (本文共51页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于遗传算法和位置特异性得分矩阵的动态转录因子结合位点识别方法

目前,生物信息学已经步入了后基因组时代,对基因非编码区的研究已经成为后基因组时代生物信息学研究的热点问题之一,其中一个主要研究方向就是对转录因子结合位点的研究。转录因子结合位点是一种重要的转录调控元件,是基因组中具有调控功能的DNA序列片段。对转录调控元件进行识别与预测,将有助于探寻基因表达调控的规律,促进基因调控网络的研究。随着研究的深入和计算机技术的发展,计算识别的方法已逐渐成为传统实验预测方法的有力辅助工具。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响,为生物实验提供较准确的数据,促进实验研究。目前,已经开发出许多识别和预测转录因子结合位点的算法和软件,如MetInspector、MEME、AlignACE、Gibbs Sampler等。本文探求一种结合两种识别方法的转录因子结合位点预测方法,即将遗传算法和位置特异性得分矩阵结合在一起,并兼顾这两种方...  (本文共45页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于PWMSA预测碱基关联三联体转录因子结合位点

调控元件是指基因周围能够与特异性转录因子结合而影响转录水平的DNA功能序列。作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。本文是基于位置权重矩阵打分函数算法预测碱基关联三联体转录因子结合位点的方法。由于已有的位置权重矩阵打分函数算法主要是针对单碱基位点保守性利用位置权重矩阵预测转录因子的结合位点。这种方法虽然可以迅速地识别出转录因子结合位点,但是由于位置权重矩阵模型假定:结合位点序列中的碱基具有独立的贡献与转录因子的结合力。然而,最近的实验研究证明这种假设是不完全的,结合位点的碱基之间存在着相互作用、共同贡献与转录因子的亲和力,考虑在非编码区中也应该与编码区中一样,以三个连续的碱基来编码一个蛋白质,因而研究三联体碱基更具有生物学意义。本文基于以前的研究,将位置权重矩阵打分函数算法应用...  (本文共42页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

一种基于遗传算法的转录因子结合位点识别方法

作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。转录因子的结合位点不是唯一的,为某一转录因子的结合位点建立一个统一的表述模型,称为Motif。目前的转录因子结合位点识别方法就是基于为已知的转录因子结合位点建立Motif模型,在基因组序列中对同类位点进行预测。本文研究了遗传算法在处理转录因子结合位点识别问题方面的可行性,提出了一种新的方法——基于遗传算法的转录因子结合位点识别方法(GATFBS)。遗传算法是模拟自然界生物进化过程的计算模型,是一种自组织与自适应的人工智能技术。作为一种全局优化搜索算法,遗传算法以其简单通用、鲁棒性强,适于并行处理以及应用范围广等显著特点,日益受到普遍重视。本文将遗传算法与转录因子结合位点识别问题相结合,以一致性序列模型作为保守序列Motif的描述模型,通过...  (本文共47页) 本文目录 | 阅读全文>>

《生物信息学》2009年01期
生物信息学

遗传算法在转录因子结合位点识别中的应用

真核生物基因组的DNA序列中,编码了两类信息,一类是DNA序列的编码区,它决定了基因产物的结构和功能;另一类是调控区,即非编码区,高等的真核生物中非编码区占了基因组的很大一部分,这部分序列中包含着决定基因组中每一个基因如何转录、表达的重要信息,也就是基因调控编码[1]。基因非编码区的一个主要研究方向是对转录调控元件的研究。基因表达的过程起始于基因的转录,转录过程的调控在基因调控的过程中起着至关重要的作用。正确的转录调控使得生物体内的能量和资源得到正确的分配。基因的调控区存在着一些能够和特异性DNA结合蛋白(即转录因子)结合的顺式作用元件,即转录因子结合位点(Transcription factor bindingsites,TFBS)。在细胞中,转录因子扮演着信使的角色。细胞接到某种外界刺激后,激活某些转录因子,然后这些激活了的转录因子与DNA上相应的结合位点结合,将RNA聚合酶吸引到相应的基因的转录起始位点附近,启动转录过程的...  (本文共4页) 阅读全文>>