分享到:

基于神经网络的蛋白质二级结构预测问题的研究

蛋白质二级结构预测问题是生物信息学的重要问题之一。本文对蛋白质二级结构预测问题进行了研究,建立了蛋白质二级结构预测数据库。研究了蛋白质的基本组成成分氨基酸的编码方式。基于 BP 神经网络建立了单神经网路和多神经网络的预测模型。并利用它们对蛋白质二级结构进行了预测研究。其主要研究内容和成果如下:(1)蛋白质二级结构评测数据库的建立论文首先从同源蛋白质数据库(Homology Derived Secondary Structure ofProteins,简称 HSSP)中提取出 36 个蛋白质文件:针对其包含复杂的数据形式,设计了一个提取数据的方法,对蛋白质数据进行预处理,提取出氨基酸序列。建立了由这些氨基酸序列构成的数据库。为蛋白质二级结构预测打下了良好的基础。(2)5 种氨基酸编码方式的比较研究论文针对正交编码、5 位编码、Codorl(基本型)编码、Codorl(扩展型)编码及 Profile编码等 5 常用的编码方法。利用  (本文共61页) 本文目录 | 阅读全文>>

西南大学
西南大学

基于神经网络的蛋白质二级结构预测建模研究

人工神经网络(ANN)技术以其具有大规模并行处理、分布存储、紫适应性、容错性等显著优点,可以有效解决难以精确建模、具有高度非线性和不确定性问题,被广泛应用于诸多领域,如预报预测、模式识别、自动控制等智能模拟和信息处理领域。随着人类基因组计划的实施和生物信息学研究的兴起,神经网络在生物信息学领域的应用也越来越多,ANN模型已广泛地应用于核酸和蛋白质序列的预测和分析中。例如,在核酸序列研究中,ANN模型在原核生物的转录终端的预测,以及大肠杆菌核糖体结合靶址的识别中都有很好的表现。ANN也应用在确定DNA序列与其性质之间的映射关系的过程中,例如转录控制信号的分析和DNA曲率的分析等。在生命活动的过程中,不同的蛋白质实现不同的生物功能。蛋白质生物功能,不仅决定于蛋白质分子的一级结构,而且,更决定于其三维结构。蛋白质的结构与生物功能是密切相关的。研究其关系,对于阐明生命现象的本质以及分子发病机理,具有重要意义。而蛋白质二级结构的研究对确定...  (本文共55页) 本文目录 | 阅读全文>>

西北农林科技大学
西北农林科技大学

基于GEP和ANN的蛋白质二级结构预测方法研究

蛋白质结构预测是生物信息学众多研究方向中的一个发展已久但仍富有挑战性的问题。蛋白质二级结构预测是蛋白质空间结构预测的一种简化和过渡,其成功预测对于确定和理解蛋白质的空间结构及功能,指导分子设计、生物制药等应用领域均具有极为重要的意义。本文以提高蛋白质二级结构的预测精度为目的,研究了基于神经网络的蛋白质二级结构预测模型、基因表达式编程对神经网络模型的优化以及氨基酸的编码方法等问题。主要研究内容和取得的结论如下:(1)针对基因表达式编程进化过程中存在的“早熟”收敛问题,通过分析算法原理,提出了基于进化效果的动态突变率和局部搜索算子两种提高基因表达式编程算法性能的改进方法。典型实例验证表明,提出的改进方法能较好地解决多样性和收敛速度的矛盾,增加算法的局部搜索能力,提高了算法的性能。(2)为了提高基因表达式编程算法的进化效率,提出了一种线性求解适应度的LFC方法。该方法不需要构造表达式树,仅用一种线性结构对染色体进行两次扫描便可完成适应...  (本文共101页) 本文目录 | 阅读全文>>

兰州大学
兰州大学

基于遗传算法和BP神经网络的蛋白质二级结构预测研究

生物信息学作为一门新兴的学科,已成为这个世纪自然科学的前沿领域之一。在生物信息学的众多研究方向中,蛋白质结构预测在生物信息学研究中占有重要地位,它的研究对于理解蛋白质结构与功能的关系,以及分子设计、生物制药等领域有很重要的现实意义。本文结合氨基酸序列的编码方式,探讨了几种改进BP(Back Propagation)算法在预测蛋白质二级结构中的应用,并对遗传优化BP(GA-BP)网络的学习过程及结果进行分析和评价。主要研究内容及成果如下:(1)分析蛋白质一级序列和二级结构的种类,及其表示方法。从HSSP蛋白质同源结构数据库中选取36条蛋白质记录,对它们的氨基酸序列和对应二级结构特征进行提取和表示,为整个研究提供了原始数据。(2)针对正交编码、5位编码及Profile编码这3种常用的氨基酸编码方法,利用BP神经网络,建立蛋白质二级结构预测模型。运用该模型研究比较这3种编码方式对蛋白质二级结构预测精度的影响。结果表明,用富含“生物进化...  (本文共63页) 本文目录 | 阅读全文>>

华中科技大学
华中科技大学

蛋白质结构预测模型研究

近20年来,随着生物数据量呈指数级增长,产生了新的交叉学科——生物信息学。而蛋白质结构与功能预测是生物信息学的一项核心研究内容,它的研究不仅能帮助人们了解蛋白质折叠的形成机制,更对实验生物学起着重要的指导作用。蛋白质结构预测的关键在于建立有效的预测模型并给出合理快速的预测算法,然而蛋白质空间结构复杂,各种结构的形成原因并不完全清楚,因此目前的预测模型和算法都有各自的局限性,预测模型的准确度和算法求解的复杂度之间也互相制约。针对这些问题,本文进行了深入的研究,提出和改进了一些蛋白质结构预测模型及方法。图论在蛋白质结构预测相关问题的研究中有着重要作用。本文将预测蛋白质二级结构问题转换成求解一个图的最短路径问题,每3个顶点表示序列中的一个氨基酸残基可能形成的二级结构,边表示可能的残基连接,并设计一个函数对边进行赋权,则这个赋权图中的最短路径对应该蛋白质的二级结构。应用这个方法,对几组测试集进行了预测,取得了较好的预测结果,并对模型中环...  (本文共112页) 本文目录 | 阅读全文>>

齐鲁工业大学
齐鲁工业大学

基于条件随机场与深度学习的蛋白质二级结构预测

随着生物信息学的发展,蛋白质数据库中的蛋白质序列信息越来越多,尤其是生物信息学的出现,使得人们能够更好地利用这些蛋白质信息了解生物系统。生物信息学可以利用这些序列信息寻找相关的蛋白质,并收集其他信息推测未知蛋白质的结构和功能等可能的特性。蛋白质结构分析预测也经常被用在药物设计中。通过实验方法获取蛋白质二级结构所需的成本高,专业人才紧缺,所以目前面临的核心问题就是利用生物信息学找到一种能够高效地预测蛋白质二级结构的算法。本文使用深度学习算法和条件随机场算法对蛋白质二级结构进行预测。在蛋白质数据处理中,本文用到了位置特异性矩阵(Position-Specific Scoring Matrix,PSSM),同时为了更好的表示氨基酸序列,使用了滑动窗口技术。在蛋白质二级结构预测算法方面,本文提出了两种学习分类方法:第一种是卷积神经网络结合Softmax分类器的算法,此方法改进了卷积神经网络的模型结构,针对梯度消失问题在各卷积层之后添加了...  (本文共79页) 本文目录 | 阅读全文>>