分享到:

波谱解析在蛋白质组学中的应用与研究

作为生命的物质基础之一,蛋白质在催化生命体内各种反应进行、调节代谢、抵御病原微生物的入侵及控制遗传信息等方面都起着至关重要的作用。随着后基因组时代的来临,蛋白质组学已成为国际的主攻领域,是生命科学最重要的研究领域之一。对蛋白质组成的分析鉴定是蛋白质组学中的主要内容,它要求对蛋白质组进行表征,即所有蛋白质的分离与鉴定及其图谱化。同时,质谱技术的飞速发展使得MS/MS成为蛋白质组学的核心技术,特别是对于蛋白质复合物的鉴定、蛋白质互联网的解析等方面也有着重大的应用。目前,已有多种对串联质谱与数据库中多肽的理论质谱的一致性进行评估的高通量计量算法用于蛋白质组学研究中。然而,它们仍存在着显著的多肽鉴定误差率,因此发展算法以提高多肽鉴定的准确性仍是目前蛋白质组信息学研究的热点。因此,首先本文针对蛋白质的多组分体系,对投影图旋转分析法进行了改进,扩展其应用范围;其次,对于蛋白质的LC-MS/MS串联质谱数据,本文结合色谱方向上的保留时间信息,  (本文共61页) 本文目录 | 阅读全文>>

中国人民解放军军事医学科学院
中国人民解放军军事医学科学院

蛋白质组质谱数据分析平台的建立及其在大规模数据分析中的应用

蛋白质组学是后基因组时代生命科学研究的热点之一,它研究生物体细胞、器官乃至组织的蛋白质表达规律,并阐明其生物学意义。蛋白质组学研究的重要技术之一是生物质谱技术,对着生物质谱技术的发展,促进了大规模蛋白质组研究的开展,实现高通量、高灵敏度和高分辨率的蛋白质组学研究分析平台。鸟枪法蛋白质组鉴定是蛋白质组研究最重要的研究策略:通过实验产出串联质谱数据,通过搜索蛋白质序列数据库获得可靠鉴定肽段结果,并进一步通过蛋白质的推导获得鉴定蛋白质结果。由于质谱数据的特性,生物样品多样、实验过程复杂、现有搜索算法和质量控制方法局限,尽管数据库搜索策略可以提高生物质谱数据的解析效率,但仍不能完全解决蛋白质鉴定问题。如何保证鉴定结果的正确性和完整性,是数据库搜索策略的主要问题。随着质谱仪不断发展,海量高精度质谱数据不断产出,大规模蛋白质组质谱数据研究的分析方法明显滞后。质谱数据分析的瓶颈,已经不再是实验数据的产出,而是数据的有效分析。因此建立质谱数据分...  (本文共85页) 本文目录 | 阅读全文>>

西安电子科技大学
西安电子科技大学

基于质谱数据的完整N-糖肽鉴定方法与算法研究

糖基化是生物界中普遍存在且非常重要的蛋白质翻译后修饰之一,有研究表明真核生物中有50%以上的蛋白质含有潜在的糖基化修饰位点。随着质谱技术的发展,研究热点从糖组学的糖链结构鉴定和蛋白质组学的糖基化位点鉴定逐渐发展到糖蛋白质组学的位点特异糖链鉴定,即完整糖肽的规模化鉴定。蛋白质糖基化的修饰在蛋白质折叠、免疫、信号传导等方面有着重要的生物学功能。在实际应用中,多种疾病诊断的生物标志物和蛋白质药物是糖蛋白,更有大量具有重要和特殊功能的糖蛋白有待深入解析其糖基化修饰与疾病的相关性,因此,迫切需要研究和开发一套能够规模化解析糖蛋白结构的算法和流程。但是由于糖结构数据库的缺乏以及糖结构本身结构的复杂性,导致N-糖肽结构解析中遇到了极大的挑战,已有的方法在解决这类问题上结果并不是很理想。在此背景下,本研究以质谱数据中糖链碎片特征的关联关系为基础,利用改进的多重最小支持度关联规则挖掘构建了B离子结构数据库,并将构建好的数据库应用在完整N-糖肽鉴定...  (本文共78页) 本文目录 | 阅读全文>>

西南大学
西南大学

基于集成算法的蛋白质复杂质谱数据分类研究

蛋白质是生物体最重要的组成成分,对蛋白质的鉴定和分类一直广受生命科学及医疗机构的高度关注。质谱是一项用来获得蛋白质、肽、有机化合物等分子质量的技术。利用质谱技术可以获得某种蛋白质的质量(Mass)与分子表达量(Intensity),以此获得该蛋白质的质谱数据。在生物化学领域,为了完成质谱数据的分类,需要借助其他仪器或仪器配备软件,这就需要投入大量的资金和人力成本。为了实现基于蛋白质的质谱数据对蛋白质进行分类,本文将使用统计分析与机器学习相结合的方法。尽管现有的机器学习方法在针对蛋白质质谱数据分类中已表现出了较好的性能,但现有的工作考虑仍不够全面,比如:没有考虑到仪器量程较小的情况,并且还有一部分研究工作利用了峰值(即生物标志点)进行分类,甚至目前大部分工作的数据样本量仅为几十或一百多个,这会导致初步结果的限制,没有考虑到在样本量过多的情况下分类器的稳定性问题,而且在实际应用中,医疗行业的质谱数据样本量往往不止几十上百个。综上所述...  (本文共53页) 本文目录 | 阅读全文>>

西南大学
西南大学

基于临床质谱数据的细菌分类研究

目前,由细菌而引发的感染性疾病越来越多,快速、准确的识别致病细菌,将对相关疾病的及时预防或治疗有着重要的现实意义。蛋白质组(Proteomics)是一切生命现象的物质支撑,对蛋白质组的研究,可以实现物种鉴定与疾病病理分析。质谱技术(Mass Spectrometry,MS)因可大量、并行、完整地检测蛋白质分子而成为蛋白质组学分析的重要手段。然而,在当前医学领域,要对所获质谱数据进行后续分析而达成细菌鉴定的目的,都必须使用某些额外的商用仪器自带软件(如CliProTools等)。重庆医科大学附属第一医院的医学检验中心(以下简称中心)经历一定时期的积累,已获取较大数量临床细菌样本的质谱数据,而前述的仪器配套软件在处理该类数据时功能有限且使用成本较高,所以中心期望与课题组合作,寻找适合的计算机领域数据分析方法对已获取的临床质谱数据进行充分挖掘,并最终能够实现细菌鉴别、辅助医疗决策。然而,质谱数据本身具有高维小样本(High-Dimen...  (本文共71页) 本文目录 | 阅读全文>>

浙江理工大学
浙江理工大学

蛋白质质谱数据分析模型及其应用

癌症是一类由控制细胞分类和凋亡的机制失常而导致的疾病。预防癌症致死的关键是提高癌症的早期诊断水平,而在癌症的早期诊断和治疗中,最主要的是找到肿瘤的潜在生物标记,蛋白质组学的发展为癌症的早期检测和诊断提供了可能,其中基于质谱技术的蛋白质组学数据分析能为肿瘤的早期诊断提供有力手段。从高维的肿瘤蛋白质质谱原始数据中挖掘出具有样本差异的标记物或者找出可以体现样本之间差异的特征,对识别恶性肿瘤的生物标记具有非常重要的意义。本文针对低样本、维数高的质谱数据,采用有效的降维方法,提取对分类预测具有高可靠性的质谱数据。按照其谱丰度的大小将其转化为蛋白质序列。利用蛋白质质谱数据准星形图的构造,提出了用两类准星形图的拓扑指数来数值刻画蛋白质质谱数据的数字特征,建立蛋白质谱的数学刻画模型。进一步地,根据得到的拓扑指数利用SVM构建二分类模型。首先应用不同的归一化方法对数据进行标准化,利用不同的SVM核函数进行分类,结果显示在[0,1]归一化时选取高斯...  (本文共57页) 本文目录 | 阅读全文>>