分享到:

Cache自适应写分配策略

随着微处理器设计和生产工艺的快速发展,存储系统的访问速度与处理器的运算速度的差距越来越显著,访存性能已成为提高计算机系统性能的瓶颈[1].如何弥补处理器与存储系统的性能差距长期以来是体系结构领域的研究热点.学术界和工业界提出许多访存优化技术,包括非阻塞Cache[2]、预取[3-4]、访存指令相关预测[5-6]等.目前关于访存优化研究多是关注如何降低或容忍访存的延时,但通常是以牺牲访存带宽为代价.在同时多线程[7]、单片多处理器[8-9]两种主流的线程级并行处理器结构中,处理器所能提供的有效带宽成为影响多线程多核对处理器加速程度的重要因素.因此,处理器性能的优化只从延时入手是不够的,必须同时考虑延时和带宽的优化,带宽优化技术是未来处理器性能提高的关键[10-11].带宽优化技术主要有两种,一种是增加处理器的传输带宽,包括提高处理器接口频率和数据通路宽度[12],采用片内内存控制器[13]等技术;另一种是减少处理器不必要的数据传输...  (本文共7页) 阅读全文>>

中国科学院研究生院(计算技术研究所)
中国科学院研究生院(计算技术研究所)

高性能存储系统研究

随着存储系统的访问速度与处理器的运算速度的差距越来越显著,访存性能已成为提高计算机系统性能的瓶颈。如何通过设计高性能存储系统弥补处理器与存储系统性能的差距长期以来是体系结构领域的研究热点。本文从提高处理器的IPC值和优化处理器的访存延时及带宽的角度出发,结合分析龙芯2号处理器运行SPEC CPU2000测试程序的访存行为特征,对存储系统性能优化技术进行研究,提出了一系列存储系统的性能优化技术并对所提出的优化技术进行性能评测与分析。本文主要的创新点及贡献包括:1.通过对Cache写失效行为的分析,提出一种新的提高处理器带宽利用率的Cache写失效处理策略——Cache自适应写分配策略。该策略在访存失效队列中收集全修改Cache块,对全修改Cache块采用非写分配策略,并能够自适应地切换为写分配策略。与传统的Cache写失效处理策略相比,Cache自适应写分配策略硬件代价小,避免了不必要的数据传输,降低Cache污染,减少存储管理队...  (本文共125页) 本文目录 | 阅读全文>>

《电声技术》2011年11期
电声技术

低码率语音编码器实现中的片上Cache分配策略

1引言多媒体应用发展迅速,其所涉及的信号处理问题的复杂度和需要处理的数据量也不断增加。对于实时性要求非常严格的多媒体应用来说,为了解决复杂的计算问题和处理大量的多媒体数据,就对嵌入式系统的性能提出了更高的要求。在此需求的驱动下,嵌入式CPU主频不断提高。处理能力提高意味着CPU与主存储器之间的数据交换量也会增加,而主存储器的发展远落后于CPU,这样就导致CPU与系统存储器之间速度的不匹配,从而影响整个系统的效率。为了解决这一问题,引入了高速缓冲存储器Cache。Cache是位于CPU和主存储器之间的一种容量很小但速度很快的存储器,其访问速度可达到主存储器的5~10倍。Cache的存取速度很高,但由于成本问题,嵌入式系统中的Cache存储空间非常有限。如何有效利用片上Cache提高系统效率,是嵌入式多媒体系统开发中的一个具有普遍意义的重要问题。从Cache的角度对系统进行优化有两种途径:一是综合考虑容量、成本、功耗等各方面的因素,...  (本文共6页) 阅读全文>>

《计算机学报》2014年07期
计算机学报

基于页着色的多核处理器共享Cache动态分区

1引言近年来,在一个芯片内集成多个处理器核已成为处理器发展的主要趋势.在这种多核处理器中,多种应用会同时运行,共享芯片内的Cache、片上网络、I/O通道等资源.多个同时运行的任务在访问共享资源时会相互干扰,可能导致资源不能被充分利用,而使任务性能下降.Cache是片内的主要共享资源之一,对Cache的使用效率直接影响应用程序的性能.例如,不同进程/线程访问不同的数据集合,可能导致共享Cache中的数据频繁换入/换出,这将降低Cache命中率,进而导致它们对内存带宽和总线带宽的争抢,使得系统性能下降.因此高效管理片上共享Cache资源是提高多核处理器系统性能的关键点之一.由于Cache对软件是不可见的,所以一些研究开始利用物理内存到Cache之间的组相联映射关系,通过操作系统的页着色来间接地实现Cache分区[1-2].页着色是利用存储器与Cache的组相联映射关系,把操作系统的页划分为多种颜色,同种颜色的内存页将会映射到相同的...  (本文共9页) 阅读全文>>

《计算机工程》2007年23期
计算机工程

支持多机环境的片上Cache的设计与实现

多处理器构成一个基于共享存储器的并行处理系统是满足巨量数据处理需求的常用途径。在多机环境下,多个CPU共享数据,如何高效处理片上Cache和主存的一致性问题是微处理器中Cache设计的关键。目前在处理Cache一致性问题上广泛采用的有两类协议:目录式和侦听式。龙腾系列微处理器是西北工业大学航空微电子中心面向嵌入式应用领域研制的32位嵌入式微处理器,与PowerPc系列处理器[1~3]的指令集兼容。1“龙腾R2”Cache结构“龙腾R2”处理器是面向嵌入式应用领域设计的嵌入式微处理器,其处理器性能很高,对存储器的要求也很高。“龙腾R2”处理器的存储层次为寄存器、一级Cache、二级Cache、主存四级结构,本文将要讨论的是其中的两级Cache结构。图1是“龙腾R2”处理器的两级Cache结构。一ca级ch指e令一ca级ch数e据二级cache系统总线图1“龙腾R2”处理器的两级Cache结构1.1一级Cache结构“龙腾R2”处理...  (本文共3页) 阅读全文>>

《中国科学技术大学学报》2007年02期
中国科学技术大学学报

一种新型的嵌入式X路组相联cache结构

0引言存储器是计算机系统的核心部件之一,其性能的好坏直接关系到整个系统性能的高低.为了填补CPU和主存在速度上的巨大差异,往往采用在CPU和主存之间设置高速缓冲存储器(cache).在现代处理器中,大量的芯片面积被存储器所占据,并且它们占用了大量的功耗.例如,Alpha21264 30%的面积和StrongARM 60%的面积是cache和存储器系统,它们的功耗占整个芯片功耗的16%和43%[1,2].对于嵌入式系统而言,其体系结构多种多样,有些简单的系统只需要控制指令循环,有些复杂的则要运行具有通讯、用户界面等功能的多任务实时操作系统.嵌入式系统只有适应各自应用的特点,才能最大地发挥其功用.嵌入式cache的设计,自然也与应用紧密地联系在一起,综合考虑性能、功耗和面积.除了电路技术可以降低功耗和面积外,很多研究者最近提出在结构层调整的办法来优化cache设计.本文分析了嵌入式应用程序访问存储的特点,提出一种新型的cache结构...  (本文共6页) 阅读全文>>

《电子设计工程》2015年19期
电子设计工程

处理器中非阻塞cache技术的研究

自从第一个微处理器问世以来,微处理器技术已经成为现代信息化社会中信息技术的核心,其研究已经成为各国在竞争中的一个热点,现在的微处理器在功能、规模、工艺以及工作频率等性能上越来越优良。由于我国致力于处理器的研究比较晚,尽管其发展速度很快,在市场上仍然没有办法与外国芯片竞争,因此研制具有自主知识产权的处理器具有极其重要的意义。1非阻塞cache技术的引用提高处理器性能可以从两方面进行:一方面提高指令并行性,同时执行多条不相关的指令。二通过提高主频,加快指令执行速度[1]。超标量处理器的研究就是从第一方面来提高处理器性能,采用流水线结构,通过增加取值、发射带宽以及复制执行部件实现多条指令的并行执行,而在引入的这些技术中对数据的使用要求比较高,因此需要高性能的cache来满足。当访问数据cache的请求在未命中时,数据cache就会由于等待从低一级存储器中取回失效的数据而阻塞发射下一条访问存储器的请求,因此导致整个处理器的工作被阻塞。以...  (本文共4页) 阅读全文>>