分享到:

并行算法简介

一、引言 数值分析这门学科是随着计算工具的发展而发展的。每当计算工具发生一次变革,数值分析算法也就相应地产生一  (本文共9页) 阅读全文>>

中国科学院研究生院(软件研究所)
中国科学院研究生院(软件研究所)

并行最优化算法与软件设计及数值软件移植

高性能计算为求解既耗时间又需要很大存储空间的大规模问题提供了强有力的工具,具有很强的实用性和高效性,并且能完成仅仅依靠个人计算机所不能达到的效果。二十年来,人们致力于研究并行最优化问题,特别是最近十年,在一些特殊的应用和对最优化问题探索更普通的并行方案中已经取得了丰硕的成果。在实际应用中,最优化问题会以不同的形式出现,可能是线性的,也可能是非线性的,可能是有约束的,也可能是无约束的。由于最优化问题的多样性,这意味着需要设计不同的并行算法和不同的计算机体系结构来求解。目前有两个代表并行最优化领域最新研究动态的方向是:(1)问题的规模和组合本质推动设计新的全局最优化问题并行求解技术,或者针对特定的问题或者针对通用的问题,针对具体的体系结构设计适当的优化算法;(2)把并行的线性代数软件和算法封装到优化代码中,因为在最优化问题中,其中的线性代数运算占有很重要的地位。特别是实现内点技术的代码,线性代数问题对其更重要。由于并行计算有其与串行...  (本文共188页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

基于MIC架构的遥感图像增强类算法并行化研究

图像去噪属于图像增强的一个重要方面,是遥感图像相关应用领域中重要的预处理步骤。目前,已有众多学者投入到对图像去噪的研究当中,并提出了很多去噪方法。但其中的大多数效果并不十分理想,去噪过程中很多图像的纹理细节被丢失掉。NLM(Nonlocal Means)算法由Buades等人于2005年提出,该算法有效地克服了上述缺点。NLM算法基于图像的自相似性原理,充分利用图像中广泛存在的大量冗余信息。在度量像素间相似性权重时,以图像片为基本计算单位,通过计算图像片灰度值向量之间的差异,确定像素间的相似程度。NLM算法对图像结构纹理有较好的保留,是目前去噪效果最好的算法之一。但由于其搜索相似像素点时的非局部特性,使得算法时间复杂度较大。针对NLM算法耗时过长的问题,本文基于英特尔集成众核(Many Integrate Core,MIC)架构在至强融核(Intel Xeon Phi)协处理器上进行了NLM并行化研究。主要内容分为以下几个方面:...  (本文共76页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

图像处理并行算法的研究

当代面临着的重大科学技术问题要依赖于计算技术协助解决,一方面要作大型计算以得到更精确的解,另一方面要作计算机模拟,以便进一步了解所探讨问题的结构与运动规律。这两个方面都离不开并行处理技术。并行处理技术领域非常广泛,包括并行体系结构、并行软件和并行算法等。由于图像处理过程中的数据量巨大,而且各种算法中大量卷积运算和矩阵乘法运算的存在,就为图像处理过程中的并行算法设计和实现提供了可能。提高图像处理的速度就是一个重大的挑战,这是由图像数据的特点和图像处理算法的复杂性引起的。并行计算是提高处理速度的有效手段之一,随着高性能并行处理系统的发展,图像并行处理技术为提高图像处理速度提供了更大的空间。本文将以并行算法在图像处理中的应用为研究对象,重点研究了并行算法在FFT和DCT变换和图像编码问题中的一些方法和应用。首先,根据快速傅立叶变换的串行算法(FFT),重点设计了在机群环境下求解计算傅立叶变换的并行算法,详细描述了设计思路,设计策略。文...  (本文共82页) 本文目录 | 阅读全文>>

中国科学院研究生院(武汉物理与数学研究所)
中国科学院研究生院(武汉物理与数学研究所)

量子动力学中并行算法的发展与应用

本文针对量子动力学理论研究中并行算法问题,发展了Shepard插值方法的计算势能的GPU算法;研究了范德华体系振转光谱的束缚态理论计算的MPI/OpenMP并行算法;研究了X+NH3反应的七维量子动力学理论方法和MPI/OpenMP并行算法,并应用于研究Cl (2P)+NH3/ND3反应。本论文的研究工作如下:1.采用改进的Shepard插值方法构造的势能面被广泛用于化学反应动力学研究,这种构造方法通过对从头算数据点进行插值来获得任意构型的能量,采用该方法构造的势能面精度高,能够更精准地研究化学反应动力学。但是在实际运用中,插值势能面计算量大,从而限制了该方法的应用。本工作基于GPU的强大计算能力和高度并行性特点,发展采用Shepard插值方法计算势能的GPU新算法。并以H+H2O? H2+OH, H+NH3?H2NH2,H+CH4?H2+CH3这3个反应的势能面为例对算法进行验证,发现GPU算法相对CPU算法具有明显的优越性,...  (本文共91页) 本文目录 | 阅读全文>>

电子科技大学
电子科技大学

电磁粒子模拟软件并行算法的研究

CHIPIC软件是由我国自主研制开发,拥有自主知识产权的全电磁粒子模拟软件,采用时域有限差分结合PIC方法实现。论文主要研究了CHIPIC软件2.5维版本泊松模块求解和三维版本粒子模拟的并行算法。泊松模块是CHIPIC软件2.5维版本的一个子模块,主要采用超松弛迭代算法来求解泊松方程。论文根据超松弛迭代自身的特点,采用“分而治之”的并行算法设计思想,设计出超松弛迭代并行算法,并分析了算法的时间复杂度、加速比和空间复杂度。为了研究的简单,论文首先对CHIPIC软件三维冷腔模拟进行了并行算法的研究。由于时域有限差分算法每个网格点电场值或磁场值的计算都只需要附近网格点的磁场值或电场值,所以同样采用“分而治之”的并行算法设计思想,完成了冷腔模拟并行算法的设计和实现,并对结果进行了正确性验证和效率测试。然后在冷腔模拟并行算法的基础之上设计了全电磁粒子模拟的并行算法,由于时域有限差分计算稳定性条件的限定,粒子在单个时间步长内不可能超过一个网...  (本文共73页) 本文目录 | 阅读全文>>