分享到:

mRNA序列、结构、能量和蛋白质二级结构的相关性

除了编码氨基酸序列以外,mRNA序列还携带了其它的结构信息,如密码子偏好,二级结构等。本文将从多个角度统计分析mRNA序列和蛋白质二级结构的相关性。论文分为4个部分。第一部分:为了更好地统计分析mRNA序列和蛋白质二级结构之间的相关性,我们建立了一个新的完整序列——结构数据库,IADE数据库。数据库由两部分组成,一部分为IADE1数据库,包含了氨基酸序列和对应的蛋白质二级结构信息,另一部分为IADE2数据库,包含了mRNA序列,氨基酸序列和蛋白质二级结构信息。IADE1和IADE2数据库分别包含2269条和648条蛋白质结构域序列。第二部分:基于IADE数据库,我们研究了mRNA的stem/loop结构和蛋白质二级结构的统计相关性。我们使用RNAstrucutre3.6程序折叠mRNA序列的二级结构。统计结果揭示出蛋白质的规则结构(alpha螺旋和beta折叠)倾向于被mRNA的stem区域编码,而无规则结构(coil)倾向于被  (本文共82页) 本文目录 | 阅读全文>>

国防科学技术大学
国防科学技术大学

蛋白质二级结构预测的模型与方法研究

蛋白质组研究是后基因组时代生命科学中最重大的研究课题之一,蛋白质结构预测是蛋白质组研究中一个发展已久但仍富有挑战性的问题,它的研究不仅对于理解蛋白质空间折叠机制与蛋白质功能具有理论价值,更对生物制药、农业生物科技等应用领域具有直接的指导作用。针对这种需求,本文应用生物信息学的方法对蛋白质结构预测的相关问题进行了深入研究,取得的主要成果与创新工作概括如下:(1) 由于传统的神经网络方法具有“黑箱”的特点,其预测或分类能力蕴含在它的各种连接参数之中,在用于结构预测时很难从模型中获取领域相关的知识与信息;而模糊推理系统则使用与人的思维方式接近的逻辑推理机制,具有易于理解的优点,但系统难以训练与学习限制了其适用范围。我们将模糊推理系统与神经网络相结合建立了自适应模糊神经网络混合模型,并首次应用于蛋白质结构预测。结果表明,模型导出的规则具有较好的可理解性,便于从中挖掘出可重用的领域相关知识。(2) 在自适应模糊神经网络模型中,输入变量维数...  (本文共132页) 本文目录 | 阅读全文>>

天津医科大学
天津医科大学

蛋白质结构预测模型的研究

目的:本论文的研究目的是提出和实施了以下两个思路,提高预测蛋白质结构的准确率和效率:1.在应用3-状态隐马尔可夫模型(Hidden Markov Model,HMM)预测蛋白质二级结构的基础上,提出和建立了7-状态和15-状态的优化HMM;进而提出通过序列谱的HMM(sequence-profile-based HMM)将优化的HMM与BP神经网络(Back Propagation Neural Network,BPNN)相结合的预测方法,提高蛋白质二级结构预测的准确率。2.综合蛋白质二级结构信息和蛋白质同源序列信息,进行蛋白质折叠预测中的二硫键预测,减少蛋白质三维结构预测中的蛋白质构象的搜索空间,提高预测的效率。方法:应用优化HMM的预测对象是从Cuff和Barton所建立的CB513数据集合中筛选出的492条已知蛋白质二级结构的蛋白质序列,共82272个氨基酸残基。将其随机分为7组,每组平均的α螺旋(H),β折叠(E),无规...  (本文共105页) 本文目录 | 阅读全文>>

哈尔滨工业大学
哈尔滨工业大学

基于机器学习的蛋白质二级结构和相互作用预测

二十一世纪是信息技术时代,同时也是生物技术时代,生物信息学正是二者的有效结合,它利用计算机科学技术解决生物学中的各种问题。随着人类基因组计划的完成,生物学走向以功能基因组学为标志的后基因组时代。作为后基因组时代的一个研究分支,蛋白质组学的研究扮演着重要的角色,这是由于生物体所执行的各种生命活动都离不开蛋白质以及它们之间的相互作用的参与。随着蛋白质测序技术、X-射线晶体衍射技术和蛋白质功能分析方法的日益发展和成熟,人们可以获得大量的蛋白质序列、结构和功能数据,这给我们创造了一个机会:采用数据驱动的方法(如机器学习技术)来预测未知的蛋白质的结构和功能。本文采用机器学习的方法对蛋白质组学研究中的一些重要问题进行了深入研究。本文的研究内容包括以下几个部分:第一,利用模式挖掘算法为每个物种构建了类似人类语言的词典——蛋白质模式词典,并对每个模式词条赋予相应的二级结构信息。针对蛋白质二级结构预测这一生物信息学中的经典问题,提出了一种基于蛋白...  (本文共133页) 本文目录 | 阅读全文>>

《生物信息学》2016年03期
生物信息学

蛋白质二级结构指定

蛋白质二级结构是指蛋白质骨架结构中有规律重复的构象。由蛋白质原子坐标正确地指定蛋白质二级结构是分析蛋白质结构与功能的基础,二级结构的指定对于蛋白质分类、蛋白质功能模体的发现以及理解蛋白质折叠机制有着重要...  (本文共7页) 阅读全文>>

《计算机应用》2013年S1期
计算机应用

蛋白质二级结构预测的多核学习方法

核方法应用于蛋白质二级结构预测已经有数年的历史。不过,基于单核的分类器只能将所有的特征一并处理,而非区别对待...  (本文共3页) 阅读全文>>