分享到:

面向应用的GPU并行技术研究

随着各研究领域的技术进步,其应用规模不断增加,对计算平台性能的要求也越来越高。本文研究内容主要在面向多媒体应用和科学计算及工程模拟应用及其核心算法。功耗瓶颈的出现使得以往通过提高处理器主频来提升性能的模式无法延续。在此背景下,多核/众核体系结构作为近期和未来提升处理性能主要发展方向,已成为学术界及产业界的广泛共识。以效能优异且峰值性能卓著的GPU为代表的协处理器不断推动着并行计算研究的发展。与此同时,以CPU-GPU为代表的大规模异构系统也是高性能计算集群重要发展方向之一。虽然,GPU硬件和体系结构不断推陈出新,随着时代需要不断发展,成果显著。但是,GPU编程技术发展相对缓慢,无法像传统CPU一样简单高效,应用程序并行化的效率问题相对突出。本文以特定的应用为对象,研究基于GPU加速器和大规模CPU-GPU异构系统的应用并行化,包括并行算法改进,算法并行化设计与优化,大规模CPU-GPU异构系统上的简单性能预测、静态负载划分和通信  (本文共125页) 本文目录 | 阅读全文>>

南京大学
南京大学

面向CPU/GPU混合架构的地理空间分析负载均衡并行技术研究

地理空间分析是地理信息科学及遥感应用领域的研究热点。随着对地观测技术的快速发展,地理空间分析面临着数据量庞大、计算过程复杂密集和计算类型多样的难题。CPU(Central Processing Unit,简称CPU)集群、GPU(Graphics Processing Unit,简称GPU)集群等新一代高性能计算硬件架构的发展,为受制于计算性能而难以开展的大区域、多尺度、异构地理空间分析提供了契机;采用高性能并行计算技术以提高地理空间数据的计算效率十分迫切和必需。如何实现并行计算过程中的负载均衡是高性能地理空间分析中的关键问题与难点。因此,发展高效、适用性强的地理空间分析负载均衡并行技术,具有重要的研究意义和巨大的应用前景。现有的地理空间分析负载均衡并行技术多集中于调用开源并行算法库中的并行化语句实现对传统地理空间分析串行算法的简单并行化封装;此外,采用的空间数据划分、并行任务调度等负载均衡策略较为单一、粗略,未能顾及不同空间数...  (本文共179页) 本文目录 | 阅读全文>>

国防科技大学
国防科技大学

面向异构多核平台的高效能猜测并行机制研究

与传统的单核处理器相比,多核处理器具有性能强、能效比高的优势。经过持续的发展,多核处理器已日益成熟,并在高性能计算、桌面计算以及移动计算等不同的领域得到了广泛应用。与此同时,多种不同架构的多核/众核处理器不断出现,导致多核处理器呈现出越来越强的异构化趋势。此外,同一处理器芯片内也集成了多个不同结构的处理器核。这些特点给异构多核平台设计和选择带来不小的难度。首先,与处理器体系结构的飞速发展相比,异构多核处理器的编程模型的发展相对滞后,无法充分发挥异构多核处理器的优势。其次,随着处理器核数的增加以及处理器核工作频率的提升,异构多核处理器功耗问题也日益突出。围绕这些问题,本文面向异构多核处理器的编程和功耗优化问题展开深入研究,主要工作和创新点有:1)深入分析了三种典型异构多核平台并论证了CPU+GPU平台作为研究线程级猜测并行技术目标平台的必要性。通过分析Intel MIC、Micron AP和AMD APU这三种异构多核平台的现状、...  (本文共134页) 本文目录 | 阅读全文>>

《中国教育信息化》2012年17期
中国教育信息化

融合多个异构系统实现图书馆智慧服务

图书馆多个异构系统独立运行容易形成"信息孤岛"。重新构建统一大系统,需要投入的成本太高,...  (本文共3页) 阅读全文>>

国防科学技术大学
国防科学技术大学

面向GPU异构系统的测评与应用研究

由于功耗和散热的限制,提升主频来增加芯片性能的道路已到尽头,多核与众核已成为处理器发展的新方向。众核协处理器因其固有的高性能、低功耗和高性价比等优势,在高性能计算领域表现优异;但也面临异构程序移植困难、众核体系结构性能优化困难、异构系统高效协同困难、数学原理/领域机理理解困难等挑战。本文重点关注面向众核体系结构的性能优化和异构系统协同优化,试图通过微benchmark测评以获知感兴趣的体系结构特性,导出相应的优化策略,并将其应用到实际应用获得性能收益。本文以众核GPU为例,重点针对众核体系结构性能优化困难和异构系统高效协同困难两方面的挑战开展研究,关注GPU的存储体系和主机端存储选择,设计微benchmark探索相关特性与规律,总结优化策略,并将其应用到高光谱影像降维和声呐信号波束形成两类实际应用中,以最大化应用执行性能。本文主要工作和创新包括以下几点:(1)针对GPU存储优化难题,提出了一种面向GPU存储系统的warp级基准测...  (本文共151页) 本文目录 | 阅读全文>>

中国石油大学(北京)
中国石油大学(北京)

面向MapReduce异构集群的低功耗调度技术研究

近年来,随着互联网技术的提升,用户数量迅猛增长,数据量急剧膨胀。快速处理及高效分析这些数据,成为一项非常迫切的任务。MapReduce异构集群已经成为被广泛使用的数据高效的处理平台工具之一。然而由于任务在集群的不合理分配,处理数据会消耗巨大的电量。本文致力于研究MapReduce异构集群低功耗调度问题,并做了以下工作:作为必要的基础知识,首先我们介绍了对于MapReduce的研究现状。而后阐述了分布式系统的计算模型。此外我们着重介绍了MapReduce的计算模型和实验必要的Hadoop的组件作用和执行流程。根据异构集群差异化执行的实际情况,在一定时间限制的前提下,为满足执行能耗和最低,我们根据MapReduce计算模型,对异构节点中不同节点分配多少任务建立模型调度建立模型。对于该组合优化问题,我们使用CPLEX12.4工具进行求解。基于求解的结果,我们在CloudSim3.0模拟分布式处理框架上对调度结果进行性能评价。在仿真实验...  (本文共50页) 本文目录 | 阅读全文>>

上海海洋大学
上海海洋大学

面向嵌入式异构多核的MapReduce多目标功耗管理研究与实现

随着人们对高性能计算的不断追求,在资源受限的嵌入式系统中,功耗逐渐成为影响多核处理器性能发挥和提升的重要约束之一。针对异构多核系统资源合理分配以及功耗管理的研究,成为目前多核领域的研究热点,也成为当前功耗管理研究的主要方向。相对硬件层面的发展,功耗管理软件技术相对滞后,但异构多核系统的能效很大程度上由系统架构上资源管理软件决定。目前软件层面绝大部分功耗管理研究主要关注处理器动态功耗,但随着集成电路的制造工艺进入纳米阶段,处理器静态功耗与动态功耗相比,在计算机系统中的功耗占比越来越大,静态功耗成为功耗管理研究中的一个重点与难点。本课题针对移动计算系统功耗约束条件时常变动及DVFS无法有效克服静态功耗导致能量损失等问题,提出一种面向嵌入式异构多核的MapReduce多目标功耗管理方法,根据实时功耗约束,制定调核策略以确定处理器核资源,并结合OS线程亲和性、进程迁移与处理器热插拔完成核的开启、关闭及负荷管理,实现多目标功耗管理。主要工...  (本文共56页) 本文目录 | 阅读全文>>