分享到:

一种基于遗传算法的转录因子结合位点识别方法

作为一种重要的转录调控元件,转录因子结合位点的识别已经成为当前的研究热点。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响。转录因子的结合位点不是唯一的,为某一转录因子的结合位点建立一个统一的表述模型,称为Motif。目前的转录因子结合位点识别方法就是基于为已知的转录因子结合位点建立Motif模型,在基因组序列中对同类位点进行预测。本文研究了遗传算法在处理转录因子结合位点识别问题方面的可行性,提出了一种新的方法——基于遗传算法的转录因子结合位点识别方法(GATFBS)。遗传算法是模拟自然界生物进化过程的计算模型,是一种自组织与自适应的人工智能技术。作为一种全局优化搜索算法,遗传算法以其简单通用、鲁棒性强,适于并行处理以及应用范围广等显著特点,日益受到普遍重视。本文将遗传算法与转录因子结合位点识别问题相结合,以一致性序列模型作为保守序列Motif的描述模型,通过  (本文共47页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于遗传算法和位置特异性得分矩阵的动态转录因子结合位点识别方法

目前,生物信息学已经步入了后基因组时代,对基因非编码区的研究已经成为后基因组时代生物信息学研究的热点问题之一,其中一个主要研究方向就是对转录因子结合位点的研究。转录因子结合位点是一种重要的转录调控元件,是基因组中具有调控功能的DNA序列片段。对转录调控元件进行识别与预测,将有助于探寻基因表达调控的规律,促进基因调控网络的研究。随着研究的深入和计算机技术的发展,计算识别的方法已逐渐成为传统实验预测方法的有力辅助工具。准确的预测、识别算法有助于人们识别不同转录因子的目标基因,进而研究转录因子结合位点在上游调控区中的位置对转录调控的影响,为生物实验提供较准确的数据,促进实验研究。目前,已经开发出许多识别和预测转录因子结合位点的算法和软件,如MetInspector、MEME、AlignACE、Gibbs Sampler等。本文探求一种结合两种识别方法的转录因子结合位点预测方法,即将遗传算法和位置特异性得分矩阵结合在一起,并兼顾这两种方...  (本文共45页) 本文目录 | 阅读全文>>

燕山大学
燕山大学

基于遗传算法的转录因子结合位点识别算法的研究

基因表达调控是理解生物体遗传机制,破解生物体奥秘的关键所在。转录是基因表达至关重要的一步,对转录因子结合位点进行识别与注释,无疑将是研究转录调控规律进而构建表达调控网络的关键步骤。随着生物技术和计算机技术的飞速发展,利用计算方法识别转录因子结合位点已经成为传统实验方法的有力辅助工具。对转录因子结合位点的准确识别,为人们研究生物机理提供了较准确的数据,促进了生物实验研究。目前已有的算法总体上可以分为两类,基于共有序列和基于位置权重矩阵。然而,这些算法往往容易陷入局部最优,不容易得到全局最优解。本文提出了两种基于遗传算法的转录因子结合位点识别算法。一种是改进的遗传算法识别转录因子结合位点,该算法目的是期望获得全局最优解;另一种是遗传算法和Gibbs采样算法相结合的转录因子结合位点识别算法,这个算法采用位置权重矩阵模型,适合多种类型的生物数据。(1)改进的遗传算法识别转录因子结合位点该算法重新定义一个适应度函数,该函数中包含位点“出现...  (本文共67页) 本文目录 | 阅读全文>>

东北师范大学
东北师范大学

基于遗传神经网络的转录因子结合位点识别方法研究

生物信息学中的一个重要研究内容就是对基因转录调控的研究。转录因子结合位点的正确识别既是揭示转录因子功能的关键之一,又是理解基因转录调控机理的重要环节。转录因子是一种特异性DNA结合蛋白,它能够识别一段特定的DNA序列(转录因子结合位点)并与之结合,进而调节DNA的代谢和转录。随着对基因研究的不断深入,为了更好地了解基因表达调控机制特别是转录调控机制,人们已经开发了许多识别和预测转录因子结合位点的算法和软件,但还有很多方面需要进一步完善和加强。作为模式识别的有力工具,神经网络具有良好的非线性逼近性和鲁棒性,已经被广泛并成功地应用于序列分析中。BP神经网络的学习规则多采用梯度下降法,梯度下降法虽然速度快,但是却容易陷入局部极小,导致其全局寻优性能不高。遗传算法具有可靠的全局搜索能力,它不依赖梯度信息,而是通过模拟自然进化过程来搜索最优解。所以,本文结合遗传算法与梯度下降法的优点,设计了一种训练神经网络权值的混合优化算法,可以利用它来...  (本文共45页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

转录因子结合位点和顺式调控模块识别方法的研究

DNA序列中转录因子结合位点的识别是解码转录调控的重要任务之一。但是,从真核生物千兆数量级的碱基对中正确识别转录因子结合位点面临着巨大挑战。为解决这一难题,本文从两方面展开研究:利用遗传表观数据来提高单转录因子结合位点识别的准确率,以及利用频繁项集挖掘技术识别顺式调控模块。研究表明,遗传表观数据中DNase I数据、组蛋白修饰数据等其它数据有助于提高转录因子结合位点识别的准确率。本文首先将转录因子结合位点识别问题转换为有监督分类学习问题。本文利用PWM得分结合DNase I数据,根据不同的模型组合成不同的特征向量,分别利用SVM和logistic回归分类器进行训练和预测。通过不同模型比较研究,发现将DNase I数据进行适当的切分,能更好的反映出DNase I数据总量特征以及DNase I数据footprint特征,从而有助于提高识别的准确率。同其它方法相比较,这种基于有监督分类学习的识别方法的识别效果是非常具有竞争力的。为了将...  (本文共79页) 本文目录 | 阅读全文>>

中国石油大学
中国石油大学

遗传算法在非满载车辆调度中的应用研究

物流配送是物流活动中直接与消费者相连的环节。在物流的各项成本中,配送成本占了相当高的比例。配送车辆调度的合理与否对配送速度、成本、效益影响很大,特别是多用户配送车辆调度的确定更为复杂。采用科学、合理的方法来进行配送车辆调度,是物流配送中非常重要的一项活动。因此,车辆调度问题(Vehicle? Routing? and?Scheduling?Problem,简记VRP)成为众多学者研究的热门话题。在高度发展的商业社会中,特别是随着Internet?的普及和电子商务的发展,消费者对时间的要求越来越严格,以往的到货“日”已转换成到货“时”。首先分析了物流配送中的车辆调度问题,并将该问题按照复杂程度的不同进行了分级。然后,根据约束条件和优化目标,提出了该问题的一般数学模型。VRP?是一个典型的?NP?难题,高效的精确算法存在的可能性不大,启发式算法虽能快速求解大型问题,但对解的质量没有保证。近些年来,人们在用遗传算法解决现实中的各种组合...  (本文共70页) 本文目录 | 阅读全文>>

内蒙古师范大学
内蒙古师范大学

基于遗传算法的汉语基本词汇自动提取研究

基本词汇是词汇的核心,也是各项语言研究的基础。自从基本词汇这一概念被提出,国内学者掀起了一股研究基本词汇的热潮。经过半个世纪的研究,已经取得了相当大的成绩,提出汉语基本词汇的多种鉴定方法,为我们综合考虑基本词汇的三大特征提供可借鉴的方法。遗传算法是生命科学与工程科学的相互交叉、相互渗透和相互作用而成的新的计算方法。它不仅具有自组织、自适应、和自学习性的智能特性,而且还具有内在的本质并行特性。算法通过适应度来评估个体的优劣。经过三十多年的研究、应用,遗传算法已成为非线性优化和系统辨识的一个有效工具。被广泛的应用于函数优化、组合优化、生产调度、自动控制、机器学习、图象处理、人工生命、机器学习等领域。在自然语言处理方面,遗传算法也受到重视,应用于信息提取、文本分类、文本聚类、数据挖掘、自动生成知识库,手写体字符识别等并取得了很好的效果。实践证明,遗传算法作为现代最优化的手段,它应用于大规模、复杂空间领域离散值情况下的全局最优化问题是合...  (本文共63页) 本文目录 | 阅读全文>>