分享到:

面向GPU异构系统的测评与应用研究

由于功耗和散热的限制,提升主频来增加芯片性能的道路已到尽头,多核与众核已成为处理器发展的新方向。众核协处理器因其固有的高性能、低功耗和高性价比等优势,在高性能计算领域表现优异;但也面临异构程序移植困难、众核体系结构性能优化困难、异构系统高效协同困难、数学原理/领域机理理解困难等挑战。本文重点关注面向众核体系结构的性能优化和异构系统协同优化,试图通过微benchmark测评以获知感兴趣的体系结构特性,导出相应的优化策略,并将其应用到实际应用获得性能收益。本文以众核GPU为例,重点针对众核体系结构性能优化困难和异构系统高效协同困难两方面的挑战开展研究,关注GPU的存储体系和主机端存储选择,设计微benchmark探索相关特性与规律,总结优化策略,并将其应用到高光谱影像降维和声呐信号波束形成两类实际应用中,以最大化应用执行性能。本文主要工作和创新包括以下几点:(1)针对GPU存储优化难题,提出了一种面向GPU存储系统的warp级基准测  (本文共151页) 本文目录 | 阅读全文>>

《中国教育信息化》2012年17期
中国教育信息化

融合多个异构系统实现图书馆智慧服务

图书馆多个异构系统独立运行容易形成"信息孤岛"。重新构建统一大系统,需要投入的成本太高,...  (本文共3页) 阅读全文>>

国防科技大学
国防科技大学

面向应用的GPU并行技术研究

随着各研究领域的技术进步,其应用规模不断增加,对计算平台性能的要求也越来越高。本文研究内容主要在面向多媒体应用和科学计算及工程模拟应用及其核心算法。功耗瓶颈的出现使得以往通过提高处理器主频来提升性能的模式无法延续。在此背景下,多核/众核体系结构作为近期和未来提升处理性能主要发展方向,已成为学术界及产业界的广泛共识。以效能优异且峰值性能卓著的GPU为代表的协处理器不断推动着并行计算研究的发展。与此同时,以CPU-GPU为代表的大规模异构系统也是高性能计算集群重要发展方向之一。虽然,GPU硬件和体系结构不断推陈出新,随着时代需要不断发展,成果显著。但是,GPU编程技术发展相对缓慢,无法像传统CPU一样简单高效,应用程序并行化的效率问题相对突出。本文以特定的应用为对象,研究基于GPU加速器和大规模CPU-GPU异构系统的应用并行化,包括并行算法改进,算法并行化设计与优化,大规模CPU-GPU异构系统上的简单性能预测、静态负载划分和通信...  (本文共125页) 本文目录 | 阅读全文>>

中国石油大学(北京)
中国石油大学(北京)

面向MapReduce异构集群的低功耗调度技术研究

近年来,随着互联网技术的提升,用户数量迅猛增长,数据量急剧膨胀。快速处理及高效分析这些数据,成为一项非常迫切的任务。MapReduce异构集群已经成为被广泛使用的数据高效的处理平台工具之一。然而由于任务在集群的不合理分配,处理数据会消耗巨大的电量。本文致力于研究MapReduce异构集群低功耗调度问题,并做了以下工作:作为必要的基础知识,首先我们介绍了对于MapReduce的研究现状。而后阐述了分布式系统的计算模型。此外我们着重介绍了MapReduce的计算模型和实验必要的Hadoop的组件作用和执行流程。根据异构集群差异化执行的实际情况,在一定时间限制的前提下,为满足执行能耗和最低,我们根据MapReduce计算模型,对异构节点中不同节点分配多少任务建立模型调度建立模型。对于该组合优化问题,我们使用CPLEX12.4工具进行求解。基于求解的结果,我们在CloudSim3.0模拟分布式处理框架上对调度结果进行性能评价。在仿真实验...  (本文共50页) 本文目录 | 阅读全文>>

上海海洋大学
上海海洋大学

面向嵌入式异构多核的MapReduce多目标功耗管理研究与实现

随着人们对高性能计算的不断追求,在资源受限的嵌入式系统中,功耗逐渐成为影响多核处理器性能发挥和提升的重要约束之一。针对异构多核系统资源合理分配以及功耗管理的研究,成为目前多核领域的研究热点,也成为当前功耗管理研究的主要方向。相对硬件层面的发展,功耗管理软件技术相对滞后,但异构多核系统的能效很大程度上由系统架构上资源管理软件决定。目前软件层面绝大部分功耗管理研究主要关注处理器动态功耗,但随着集成电路的制造工艺进入纳米阶段,处理器静态功耗与动态功耗相比,在计算机系统中的功耗占比越来越大,静态功耗成为功耗管理研究中的一个重点与难点。本课题针对移动计算系统功耗约束条件时常变动及DVFS无法有效克服静态功耗导致能量损失等问题,提出一种面向嵌入式异构多核的MapReduce多目标功耗管理方法,根据实时功耗约束,制定调核策略以确定处理器核资源,并结合OS线程亲和性、进程迁移与处理器热插拔完成核的开启、关闭及负荷管理,实现多目标功耗管理。主要工...  (本文共56页) 本文目录 | 阅读全文>>

华中科技大学
华中科技大学

面向GPU/CPU异构系统的数据流任务划分与调度

异构计算机结合了GPU的强大并行能力和CPU的逻辑处理能力,在商业和科研领域被广泛使用。但要充分发挥异构计算机的性能,需要对硬件资源进行合理的调配。COStream作为一种数据流编程语言具有通信和计算分离的特点,在传统多核CPU上有良好的并行效果,但面对异构系统的复杂环境,其也面临着设备间负载不均衡、通信开销过大等问题。为了充分发挥异构系统的优势,以COStream数据流编程语言为研究对象,设计了面向GPU/CPU异构系统的数据流任务划分算法和优化方案,包括异构负载均衡划分算法、设备间通信节点优化和NDrange(N-Dimension range)优化。异构负载均衡划分算法分为设备间数据流任务初步划分、负载预估与负载调整、设备内任务划分三个步骤,结合数据流图的并行特性对数据流任务进行层层划分。该算法具有两大优势:充分挖掘数据流程序的并行特性,将计算节点按照其特性划分到最适合的计算设备,发挥各计算设备优势;预估并调整了设备间的负...  (本文共52页) 本文目录 | 阅读全文>>