分享到:

一种基于遗传算法的转录因子结合位点识别方法

作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。转录因子的结合位点不是唯一的,为某一转录因子的结合位点建立一个统一的表述模型,称为Motif。目前的转录因子结合位点识别方法就是基于为已知的转录因子结合位点建立Motif模型,在基因组序列中对同类位点进行预测。本文研究了遗传算法在处理转录因子结合位点识别问题方面的可行性,提出了一种新的方法——基于遗传算法的转录因子结合位点识别方法(GATFBS)。遗传算法是模拟自然界生物进化过程的计算模型,是一种自组织与自适应的人工智能技术。作为一种全局优化搜索算法,遗传算法以其简单通用、鲁棒性强,适于并行处理以及应用范围广等显著特点,日益受到普遍重视。本文将遗传算法与转录因子结合位点识别问题相结合,以一致性序列模型作为保守序列Motif的描述模型,通过  (本文共47页) 本文目录 | 阅读全文>>

燕山大学
燕山大学

基于遗传算法的转录因子结合位点识别算法的研究

基因表达调控是理解生物体遗传机制,破解生物体奥秘的关键所在。转录是基因表达至关重要的一步,对转录因子结合位点进行识别与注释,无疑将是研究转录调控规律进而构建表达调控网络的关键步骤。随着生物技术和计算机技术的飞速发展,利用计算方法识别转录因子结合位点已经成为传统实验方法的有力辅助工具。对转录因子结合位点的准确识别,为人们研究生物机理提供了较准确的数据,促进了生物实验研究。目前已有的算法总体上可以分为两类,基于共有序列和基于位置权重矩阵。然而,这些算法往往容易陷入局部最优,不容易得到全局最优解。本文提出了两种基于遗传算法的转录因子结合位点识别算法。一种是改进的遗传算法识别转录因子结合位点,该算法目的是期望获得全局最优解;另一种是遗传算法和Gibbs采样算法相结合的转录因子结合位点识别算法,这个算法采用位置权重矩阵模型,适合多种类型的生物数据。(1)改进的遗传算法识别转录因子结合位点该算法重新定义一个适应度函数,该函数中包含位点“出现...  (本文共67页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于遗传算法和位置特异性得分矩阵的动态转录因子结合位点识别方法

目前,生物信息学已经步入了后基因组时代,对基因非编码区的研究已经成为后基因组时代生物信息学研究的热点问题之一,其中一个主要研究方向就是对转录因子结合位点的研究。转录因子结合位点是一种重要的转录调控元件,是基因组中具有调控功能的DNA序列片段。对转录调控元件进行识别与预测,将有助于探寻基因表达调控的规律,促进基因调控网络的研究。随着研究的深入和计算机技术的发展,计算识别的方法已逐渐成为传统实验预测方法的有力辅助工具。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响,为生物实验提供较准确的数据,促进实验研究。目前,已经开发出许多识别和预测转录因子结合位点的算法和软件,如MetInspector、MEME、AlignACE、Gibbs Sampler等。本文探求一种结合两种识别方法的转录因子结合位点预测方法,即将遗传算法和位置特异性得分矩阵结合在一起,并兼顾这两种方...  (本文共45页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于遗传神经网络的转录因子结合位点识别方法研究

生物信息学中的一个重要研究内容就是对基因转录调控的研究。转录因子结合位点的正确识别既是揭示转录因子功能的关键之一,又是理解基因转录调控机理的重要环节。转录因子是一种特异性DNA结合蛋白,它能够识别一段特定的DNA序列(转录因子结合位点)并与之结合,进而调节DNA的代谢和转录。随着对基因研究的不断深入,为了更好地了解基因表达调控机制特别是转录调控机制,人们已经开发了许多识别和预测转录因子结合位点的算法和软件,但还有很多方面需要进一步完善和加强。作为模式识别的有力工具,神经网络具有良好的非线性逼近性和鲁棒性,已经被广泛并成功地应用于序列分析中。BP神经网络的学习规则多采用梯度下降法,梯度下降法虽然速度快,但是却容易陷入局部极小,导致其全局寻优性能不高。遗传算法具有可靠的全局搜索能力,它不依赖梯度信息,而是通过模拟自然进化过程来搜索最优解。所以,本文结合遗传算法与梯度下降法的优点,设计了一种训练神经网络权值的混合优化算法,可以利用它来...  (本文共45页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

转录因子结合位点识别问题的算法研究

转录是基因表达的第一阶段,也是基因调节的主要阶段,通过转录因子与特异的DNA序列结合,对基因的表达起抑制或增强的作用。识别DNA序列的中的这些结合区域,即转录因子结合位点识别,对了解基因的转录活性及理解基因表达有着重要意义,是现今生物信息学中最为广泛研究的问题之一。转录因子结合位点识别问题的难点在于,与大量长度几百或上千碱基的背景噪声序列相比,长度为十几或几十的模体信号相对较短,并且同一转录因子的模体实例还有可能部分发生变异。同时,随着序列长度和数量的增加,解空间大小也会飞速巨增,计算开销往往不切实际。此外,识别结合区域中的多个转录因子结合位点、寻找特定的共调控转录因子结合位点组合以及在全基因组范围内寻找结合位点,也是此问题所面临的巨大挑战。本论文针对转录因子结合位点识别问题中所使用的数学模型、优化技术、高效识别方法以及与新型生物实验结合的进一步发展等问题进行了深入的研究,将所提出的方法应用于模拟字符串数据、不同物种和组织的启动...  (本文共112页) 本文目录 | 阅读全文>>

《绿色科技》2017年08期
绿色科技

基于遗传算法给水管网状态估计

1引言给水管网状态变量是管网运行工况的真实反映,是管网科学管理的依据,是实现供水管网优化调度的基础,以精确可靠的管网微观水力模型为前提条件,准确及时地获取状态变量信息对实现管网科学管理、调度决策具有重要意义[1]。管网状态估计过程实质上是节点需水量的估计过程,通过估计的节点需水量经平差计算获得状态解。节点需水量的估计需要用到迭代的思想,目前有两种常用的方法:遗传算法(GA)[2]和加权最小二乘法(WLS)[3]。遗传算法是一种人工智能算法,每次迭代搜索目标解是随机的,不需考虑对象的特定知识。遗传算法编程实现简单,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性限定,具有更好的全局寻优能力,采用概率的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向而不需要确定的规则。WLS是一种基于梯度的算法,在每次迭代搜索目标解时都是从对象函数的梯度信息出发。WLS在每次迭代过程中需要进行繁杂的雅可比矩阵计算,而遗传算法...  (本文共3页) 阅读全文>>

《组合机床与自动化加工技术》2007年05期
组合机床与自动化加工技术

遗传算法解决车间作业调度问题的优化研究

0引言遗传算法在理论上具有概率1的收敛特性,但在解决实际问题时往往会出现早熟收敛或收敛缓慢等缺点。对于JSP问题,由于其编码与函数值之间无确定的规律联系,因此在解空间中存在非常多的局部极小点,在解空间搜索时,算法极易收敛于某一局部极小点,造成早熟收敛。图1显示了普通遗传算法对FT06算例进行寻优计算的状况,由图1可看出,算法在第50代左右已收敛于局部最优解58(全局最优解为55),直到第200代仍不能取得任何进展。因此遗传算法用于解决Job Shop问题时必须进行改进。目前大多数文献研究重点主要是如何改变遗传算法的结构以及如何用新的理念来改造遗传算法,如Nakano[1],Yamada&Na-kano[2],Fang,H.-L.,Ross,P,&Corne D[3],以及G.H.K im and C.S.G.Lee[4],Guoyong Shi,H itoshi Iima,andNobuo Sannom iya[5],Morik...  (本文共4页) 阅读全文>>