分享到:

一个串行程序的并行执行方案

本文描述一个串行程序的并行执行方案。此方案不要求在程序的实际执行之前有额外的并行性探测过程。在被执行的语句中  (本文共5页) 阅读全文>>

中国科学技术大学
中国科学技术大学

逻辑核动态可重构的众核处理器体系结构

随着半导体技术的发展,摩尔定律继续有效,单块芯片上集成的处理器核数将不断增加;同时为追求更高的性能功耗比和性能面积比,众核结构成为芯片设计的必然选择。众核处理器中丰富的计算资源和高效的片上通信使得面向吞吐率的应用具有天然的性能优势,但是由于处理器核粒度变小,在单核上执行串行应用的性能无法保证。为解决这一问题,近年来具有逻辑核构造能力的众核处理器体系结构研究备受关注,其基本思想是基于多个细粒度处理器核(称为物理核)构建粗粒度逻辑核,期望利用众核结构丰富的计算资源,将不断增加的处理器核转化为单线程串行应用的性能提升。目前已有的工作对这种众核结构的通信开销处理、逻辑核粒度配置灵活性和应用映射方式等方面尚缺乏深入的研究。本文针对细粒度众核结构上串行程序的有效执行问题,从执行模型、微结构设计和动态资源控制等几方面展开深入探讨,对于探索逻辑核动态可重构的众核处理器体系结构具有重要的学术意义和应用价值。本文主要研究内容和成果包括以下几个方面。...  (本文共139页) 本文目录 | 阅读全文>>

西南交通大学
西南交通大学

Linux应用程序多核并行化方法研究与实现

随着多核处理器的普及,在以后的数年里,各个领域的计算机都将很快发展成并行计算机,这包括服务器,笔记本等个人电脑,手机等等。这和传统处理器有着本质区别,因为一直以来,处理器的厂商都是通过不断提高主频来提高处理器的性能,但从体系结构来看,这种传统处理器体系结构技术面临瓶颈,晶体管的集成度已超过数亿个,很难单纯地通过提高主频来提升性能,另一方面,主频的提高将同时导致功耗的提高。因此,多核成为处理器发展的必然趋势。而软件也将面临很大的挑战,当然,这对软件行业来讲,同时也是机遇。因为软件的性能不会像传统模式那样简单地随着硬件的升级而得到显著地提升,除非是适合并行计算的软件。但是,如果完全重新开发适合多核平台的并行软件,不仅浪费大量的传统程序资源,而且也不能在短期内满足应用需求。本文针对多核通用开发,在Linux下运用并行开发模型和方法,结合使用Intel多核系列开发工具,对多媒体应用中的一个串行程序运用Intel Vtune Perfor...  (本文共66页) 本文目录 | 阅读全文>>

大连理工大学
大连理工大学

基于并行设计模式的软件演化方法研究

成熟的应用软件系统已经被运行在单个UE(Unit of Execution)的硬件环境中来帮助人们解决数据和业务逻辑问题。但是随着计算机的广泛应用,软件系统被应用到越来越复杂的问题当中以至于单个UE已经不能及时的处理,这就迫切需要多个UE协同操作来完成大量的数据和业务逻辑计算。所以对于这些应用系统的软件演化就成为一个解决这个问题的主要方式,使它们能从单个UE的串行平台转移到多个UE的并行平台。软件演化是在软件系统的生命周期内对软件进行维护和软件更新的一种动态行为。系统需求的改变、功能实现的增强和运行环境的改变等等都无不需要对软件进行演化。串行软件的并行化就是一种由于系统运行环境改变而引起的一种演化行为,它对串行代码进行并行化使其适应多UE的运行平台。重新分析并设计这个软件系统会浪费大量的时间和精力,还容易产生一些错误。因此,对于串行软件进行自动并行化的研究成为解决这个问题的途径。现在大量的串行代码自动并行化的系统已经出现,实现了...  (本文共65页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

多核平台下串行程序的并行化改造

在人们将CPU的性能一步步推向高点的时候,多核已经取代了单核统治了当下的PC平台。为了充分利用多核平台强劲的计算资源,并让众多经过时间检验的优秀串行程序旧物新用,从而保持软件设计与硬件提升的协调,对串行程序并行化改造的研究显得颇为重要且已较为活跃。本文以串行程序并行化的重点技术-控制依赖和数据依赖的分析为基础,提出一个基于带权集合的串行程序并行化方案,重点研究了控制依赖和数据依赖的分析方法,并以实际工作中一个课题CRAES系统①的并行化改造为依据,对基于带权集合并行化方案加以深入分析和讨论。主要研究内容分为四部分。(1)对串行程序并行化的相关知识(串行程序、并行程序、并行程序设计方案、并行编程模型以及程序控制依赖和数据依赖)进行总结。(2)以CRAES系统的并行化改造为依据,对本文所提方案的需求分析及概要设计进行说明。(3)详细阐述控制依赖分析方法和数据依赖分析方法,并给出改进的算法;从数据分解、任务分解、循环级分解的角度分析了...  (本文共79页) 本文目录 | 阅读全文>>

东北大学
东北大学

CUDA计算技术在生物序列数据处理中的应用研究

目前新的高通量DNA测序技术能够在很短的时间内以较低的成本生成大量的序列数据,生物序列的数据量正以爆炸式的速度快速增长。与此同时,计算机处理器的频率已接近理论极限,这意味着现存的串行算法很难像以前一样依靠频率的提高获得性能提升。并行处理技术成为解决这一效率差异的必然选择之一。由于GPU比CPU拥有更强的计算能力和更高的内存带宽,而生物序列数据又具有数据量大、数据结构简单的特点,本文采用基于数据并行处理指令体系的GPU众核计算技术来实现生物序列数据的廉价高效处理。本文根据复杂程度的不同,精心筛选出若干个经典序列分析问题作为并行处理的研究对象,分别给出高效的数据并行算法设计,并通过CUDA并行计算平台加以实现、分析和优化。本文的主要贡献总结如下:第一,对CUDA计算涉及的软硬件并行体系结构特点进行了比较全面的研究。基于GPU属于SIMD并行指令体系的特点,总结并归纳了常用的基本数据并行操作,为并行算法的设计和实现提供了基本的参考和指...  (本文共128页) 本文目录 | 阅读全文>>