分享到:

基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究

人工智能的发展对科技和经济的发展起了重大的推动作用。尤其在解决复杂优化、减少反应时间和促进产品的开发等方面表现更为突出。随着科技的进步,大量数据的产生需要有效的方法才能得出更加可行的结果,有利于促进科技的快速发展。因此研究新的高效数据挖掘方法和寻找规律已成为人工智能研究的迫切需要。本文对一种新的数据挖掘方法:基因表达式编程(gene expression programming,GEP)进行研究,GEP是一种新的机器学习算法,具有优异的泛化能力,是由Ferreira C.于1999年根据遗传算法和遗传程序发展而来的。本论文主要对GEP的原理和在定量结构—性质/活性关系(QSPR/QSAR)和疾病诊断方面的进行了应用研究。第一章:对GEP算法原理、实现步骤以及研究现状进行了详细的综述,并对GEP和支持向量机(support vector machines,SVM)在疾病诊断和QSAR中的应用现状进行了综述。第二章:应用GEP和SV  (本文共181页) 本文目录 | 阅读全文>>

《化学进展》2003年05期
化学进展

表面活性剂的QSAR/QSPR研究进展

一、引 言表面活性剂由于其独特的双亲分子结构 ,不仅在许多传统工业领域一直被广泛、大量使用[1] ,近年来在若干新兴科学技术领域也呈现出强劲发展的势头。应用胶束、微乳液制备尺寸稳定可控的纳米粒子 ,以及用溶致液晶制备纳米中孔材料已得到较为广泛的应用 [2 ]。各种以两亲分子为主体形成的膜结构体系在光化学太阳能的转换和储存、分子识别和运输、药物的胶囊化、靶向和缓释 ,为底物和酶提供独特的微环境以及酶固定化等方面也有着十分诱人的应用前景[3 ,4] 。另一方面 ,表面活性剂的大量使用对环境 ,尤其是对水质和土壤的影响 ,也在受到更多的关注[5] 。因此 ,研究表面活性剂结构与性能的定量相关关系 ,认识各个层次的分子结构因素对分子功能与性质的影响 ,正成为表面科学中日益受到关注的一个研究领域 [1] 。在表面活性剂研究、开发和应用的过程中 ,积累了有关其性质与活性的大量参数。其中 ,利用热力学函数及相关数据和其他大量实验结果 ,已在表...  (本文共10页) 阅读全文>>

《哈尔滨工业大学学报》2009年12期
哈尔滨工业大学学报

脂肪醇生物活性和理化性质的QSAR/QSPR研究

借助于计算机技术建立的结构———性质/活性关系,称为定量构效关系(QSAR/QSPR),其研究的依据是化合物的性质和微观结构之间具有相关性,所以可以把结构定量化,然后和其性质/活性建立数学模型,并用此模型预测未知物理化性质和生物活性的递变规律.由于该方法具有重要的理论和应用价值,所以目前被普遍关注.在QSAR/QSPR的应用过程中,使用最广泛的是分子拓扑指数,目前已经有200余种拓扑指数被建议[1-5],作者在距离矩阵的前提下,用对C-C键的相对键长取代矩阵中的拓扑距离,提出一个新的距离调和拓扑指数,该指数适用于各种含杂原子和不饱和键的化合物,并与化合物的理化性质、生物活性、污染物的毒性均具有良好的相关性.本文以脂肪醇为例,研究了其溶解度、辛醇/水分配系数、半数致死浓度、蒸发热、摩尔磁化率、气相色谱保留指数等生物活性、理化性质与Te的相关性,均取得满意结果,优于文献.该指数可用于脂肪醇多种性质的预测.1距离调和指数的建构方法用隐...  (本文共4页) 阅读全文>>

《计算机与应用化学》2010年02期
计算机与应用化学

QSAR/QSPR模型验证方式与预测能力的关系研究

1引言长期以来,在定量结构一活性(性质)关系(QSA份QSPR)研究中,研究者往往通过使用留一或留k交叉验证法,仅从内部验证角度来确定模型预测能力的高低I‘一’〕。但在2以科年QSAR国际会议上正式形成的OECD(The Organi-sation for Eeono而e Co一。胖ration and Development)规则,已明确规定必须使用外部验证集来评价模型的预测能力〔’0]。目前国内学术刊物上关于QSA份QSPR的研究报告中,尚少见有明确遵循OECD规则的论文发表,为此,本文以45种攀酮和二氢肇酮衍生物以及37种蔡馄酷衍生物作为研究对象,分别从同系列衍生物和不同系列衍生物2个方面,研究QsAR建模中内部验证和外部验证与模型预测能力的关系。将45种辜酮和二氢辜酮衍生物〔川以及37种蔡馄醋衍生物〔”〕分别按文献[’‘一”〕分为训练集和预测集,采用增。减1法选择变量,建立多个QSAR模型,以留一法交叉验证对训练集做内部...  (本文共5页) 阅读全文>>

《广西民族大学学报(自然科学版)》2008年02期
广西民族大学学报(自然科学版)

一种新拓扑指数与饱和烷烃QSAR/QSPR研究

结构决定性质,性质反应结构是研究物质物理化学性质的基础,从分子结构中提炼出的结构信息能够更好的描述、分析,预测物质的物理化学性质.有关物质定量结构—性质/活性相关的研究一直是国内外化学的研究热点[1].目前对有机物性能和结构的研究,基本上有2类,一是用拓扑指数与物质的性能关联;二是用经验参数与物质的性能关联[2].笔者以分子图的邻接矩阵,距离矩阵为基础,定义了新的拓扑指数Wq,并结合烷烃分子的有效碳链长[2]1、x阶分子连接性指数,应用SPSS15.0软件,从最优子集出发与39种链烷烃的部分物理化学性质相关联,结果较为满意.1分子拓扑指数和有效碳链长度的构建1.1分子拓扑指数的构建纯粹数学意义下的拓扑学是研究空间及其在拓扑变换下的不变性,分子拓扑学正是基于这一思想———舍弃集合对象的量度特征,而仅仅决定于原子间相互连接次序的某些性质[3].用拓扑方法可得到分子的拓扑图即分子的隐氢图,邻接矩阵A=[aij]n*n,n为顶点数aij...  (本文共4页) 阅读全文>>

《计算机与应用化学》2006年06期
计算机与应用化学

QSAR/QSPR模型中的蒙特卡罗交叉效验评价

1引言在定量构效关系(qu antitative strueture一aetivity relationship,QSAR)或定量构性关系(quantitative structure一property relationship,QSpR)研究中,模型的评价尤为重要川,因为它既可指导学习方法或选择模型,又可为我们提供最终选定模型的质的度量[2〕。模型的评价似应从两个方面入手,一是考察模型的预测误差,再就是考察模型的预测稳定性。模型的预测误差越小,或模型预测的稳定性越好,模型的质量就越高。模型预测误差的常用的估计方法有Cp统计量、Akaike信息准则(Ale)[’)、贝叶斯信息准则(Blc)[‘〕、介一折交叉效验和自助法陈‘了等。前面3种方法是利用模型的训练误差来估计预测误差,且只能用于线性模型,而k一折交叉效验和自助法则是通过有效的样本重用,直接近似地估计模型的预测误差,兼用于线性或非线性模型。k一折交叉效验是估计预测误差最常用...  (本文共5页) 阅读全文>>