电脑互动吧

 找回密码
 注册
查看: 7711|回复: 13

CPU缓存比较

[复制链接]
发表于 2012-3-3 00:00:43 | 显示全部楼层 |阅读模式
三级缓存是为读取二级缓存后未命中的数据设计的—种缓存,在拥有三级缓存的CPU中,只有约5%的数据需要从内存中调用,这进一步提高了CPU的效率。




目录

运作原理三级缓存分类二级缓存的价格和发展三级缓存的性能影响三级缓存的历程AMD关于三级缓存的态度Intel(16MB三级缓存)6核处理器无三级缓存版AMD 45nm处理器

展开

编辑本段运作原理  其运作原理在于使用较快速的储存装置保留一份从慢速储存装置中所读取数据且进行拷贝,当有需要再从较慢的储存体中读写数据时,CACHE能够使得读写的动作先在快速的装置上完成,如此会使系统的响应较为快速。
编辑本段三级缓存分类  Cache(三级缓存),分为两种,早期的是外置,以后的升级产品都是内置的。而它的实际作用即是,L3缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。降低内存延迟和提升大数据量计算能力对游戏都很有帮助。而在服务器领域增加L3缓存在性能方面仍然有显著的提升。比方具有较大L3缓存的配置利用物理内存会更有效,故它比较慢的磁盘I/O子系统可以处理更多的数据请求。具有较大L3缓存的处理器提供更有效的文件系统缓存行为及较短消息和处理器队列长度。
  其实最早的L3缓存被应用在AMD发布的K6-III处理器上,当时的L3缓存受限于制造工艺,并没有被集成进芯片内部,而是集成在主板上。在只能够和系统总线频率同步的L3缓存同主内存其实差不了多少。后来使用L3缓存的是英特尔为服务器市场所推出的Itanium处理器。接着就是P4EE和至强MP。Intel还打算推出一款9MB L3缓存的Itanium2处理器,和以后24MB L3缓存的双核心Itanium2处理器。
  但基本上L3缓存对处理器的性能提高显得不是很重要,比方配备1MB L3缓存的Xeon MP处理器却仍然不是Opteron的对手,由此可见前端总线的增加,要比缓存增加带来更有效的性能提升。
编辑本段二级缓存的价格和发展二级缓存价格  首先来算一笔小账(2009年02月),关于Intel处理器的二级缓存:
  二级缓存512K的赛扬双核E1200只要270元,二级缓存1M的奔腾双核E2140售价为370元,需要花费100元来购买这额外的512K缓存;二级缓存2M的酷睿2 E4300或者奔腾双核E5200的售价在550元以上,这就意味着得再出200元来购买这额外的1M二级缓存;二级缓存3M的酷睿2 E7200售价750元,又得掏出200元来购买这额外的1M二级缓存;二级缓存4M/6M的酷睿2系列处理器依次类推……
  不管酷睿2、奔腾双核还是赛扬双核,他们的核心架构其实是完全相同的,频率可以随意更改,唯一不同的就是二级缓存。可以毫不夸张地说,Intel就是在卖二级缓存,200块钱1M。
  事实上历年来Intel都是通过二级缓存的大小来划分产品线,初期只有奔腾和赛扬两种规格,到了酷睿2时代Intel达到了登峰造极的境界:仅仅是双核产品就拥有512K、1M、2M、3M、4M、6M多达六个版本,四核产品也有4M、6M、8M、12M四个版本,令人眼花缭乱!Intel细分产品线的策略在每个价位都提供了优秀的产品,但也给广大用户制造了前所未有的困惑:到底多大二级缓存才够用?二级缓存发展  纵观英特尔处理器的发展,且不论核心架构如何改变,以级数增长的二级缓存是最直观的。奔腾4时代0.18微米工艺的Willamette拥有256K二级缓存,0.13微米的Northwood核心拥有512K,后期0.09微米的Prescott一度增大到1M。到了酷睿时代,在架构发生了翻天覆地的变化的同时,65纳米工艺让二级缓存再次翻倍,即便是刚推出时低端酷睿的代表Allendale核心,二级缓存也达到了2M,高端酷睿更是拥有4M的二级缓存。进入45nm工艺后,二级缓存的容量进一步加大,高端E8X00系列二级缓存达到了惊人的6M,低端E7X00也达到了3M之多,至此Intel从512K到6M甚至12M实现了二级缓存的“无缝衔接”。[1]
  市场中没有永远的落后者,当AMD进入45nm时代,Phenom II的到来,AMD也能通过核心数量和缓存的搭配,设计出定位不同市场的CPU。
编辑本段三级缓存的性能影响  而三级缓存对性能影响时高时低。在游戏方面,提升三级缓存的容量对游戏的性能影响很大,虽然对一般家用机没有什么用,但是如果是网吧机或者是发烧机提升三级缓存的容量还是会有显著的性能提升的。虽然三级缓存也能为PC带来显著的性能提升,但毕竟三级缓存是作用于服务器的,对PC来说,三级缓存还是只能做个辅助作用,在其他参数相同的情况下,三级缓存容量越大,则性能更好,如果其他参数不相同的话,这时三级缓存的作用就不明显了。
  不管三级缓存的作用大不大,它也是为电脑发展作出贡献的参数之一。
编辑本段三级缓存的历程  纵观AMD Phenom处理器的发展,核心架构的改进相对有限,而三级缓存的变化是最直观的。从早

从硬件系统配置看三级缓存


期Phenom的2MB三级缓存,猛增至Phenom II的6MB三级缓存,而为了市场的需要,又推出了采用Phenom II架构但没有三级缓存的Athlon X4。而AMD处理器独有的双核、三核、四核架构,加上缓存的不同搭配,一时间,AMD处理器呈现出门丁兴旺的景象。
  对于AMD的用户来说,多是追求性价比的用户,而AMD处理器这样的现象,对用户即是好事也是坏事,好是用户的选择更多了,坏的是用户对CPU的选择无所适从。而细细观察,AMD处理器百龙争宠的现象,无外乎是核心与缓存搭配的结果。
  与65nm Phenom相比,新一代45nm Phenom II最大的变化就是升级到了45nm SOI沉浸式光刻生产工艺,好处就是主频更高、功耗更低、集成度更高,特别是三级缓存从2MB猛增到了6MB!
  三级缓存翻了三倍,自然需要付出一定的代价,通过Phenom和Phenom II芯片示意图的对比,就能略知一二了:
  Brcelona/Agena集成了4.68亿个晶体管,核心(Die)面积大约285平方毫米,Shanghai/Deneb的晶体管增加了62%,多达7.58亿个,但核心面积却减小了9.5%,只有258平方毫米,新工艺的好处可见一斑。
  晶体管数量增加如此之多主要就是因为三级缓存的大幅扩容,这部分在整个核心里的面积比例也从大约六分之一提高到了足有三分之一。
编辑本段AMD关于三级缓存的态度  第一,三级缓存容量在服务器领域的作用更明显,不过如果服务器和桌面处理器采用不同的架构,必然会提高生产难度和成本,故而带到了桌面上;
  第二,在桌面上,三级缓存从2MB增加到6MB可以带来大约5%的性能提升,实际测试也证明了这一点;
  第三,从前边的数据看出,三级缓存增加了两倍,但得益于生产工艺的改进,核心面积反而更小了,成本也更低。
  熟悉Intel Nehalem Core i7(酷睿i7)处理器的人一定想到了,Intel也使用了同样的大容量共享三级缓存设计,且容量多达8MB,也占据了整个核心面积的三分之一左右,不同之处在于Core i7每核心一级缓存和二级缓存只有64KB和256KB,都比Phenom/Phenom II少一半。
  有趣的是,同样基于45nm工艺的Core i7集成了7.31亿个晶体管,比Phenom II略少,但核心面积却稍大一些,为263平方毫米。
  从成本的角度来算一笔帐,通过Phenom II X4的芯片结构示意图可以看出,三级缓存所占芯片面积比两颗核心以及L1L2加起来还要多,如此一来即便是屏蔽了一颗核心的Phenom II X3,其成本也并不低,这对于主打性价比路线的AMD来说,利润损失会比较大。
  于是,AMD在发布Phenom II X4、X3处理器之后,也在积极准备定位主流中低端的产品,用以取代征战多年的Athlon 64 X2系列。由于L3成本较高,因此AMD把Phenom II X4的三级缓存彻底删去(注意不是屏蔽),Athlon X4便与大家见面了。
  如此一来,人们就可以通过对比评测,轻松了解到AMD的Phenom II架构处理器中,6M L3对性能的贡献有多大,也能提前了解拥有完整L3但却少一颗核心的Phenom II X3强呢,还是没有L3的但却有四颗核心的Athlon X4强?相信很多朋友都会挺感兴趣的。
  AMD已上市的Phenom II 920(6M L3)和Phenom 9850(2M L3),还有一颗神秘的没有L3的Athlon X4工程样品,让他们都工作在200*14=2.8GHz频率下,这样就能直观的对比6M/2M/0M三级缓存所造成的性能差异。
  另外还加入了刚刚发布的Phenom II X3 720处理器,它拥有完整的6M三级缓存,但少一颗核心,这样可以反映出多一颗核心的贡献大还是6M L3的贡献更大?测试结果表明,从CPU架构上看,缓存对性能的影响很大,但Athlon X4的表现,尤其是在大量运算过程中,力压上代拥有完整3级缓存的9850,内存带宽的优势不言而喻。[2]
编辑本段Intel(16MB三级缓存)6核处理器  首先推向市场的是高端桌面PC处理器品牌酷睿i7和针对高能效服务器市场的Nehalem-EP,预计2009年第四季度即可上市。随后,新架构产品会陆续推出,包括针对可扩展服务器市场的Nehalem-EX,桌面市场的Havendale和Lynnfield,移动市场的Auburndale和Clarksfield,预计都在2009年下半年登场。
  下一代Core微架构(Nehalem)处理器均从4核起跳,但同时采用了Hyper-Threading技术,可同时处理8个线程。Core i7支持Turbo Mode和Power Gates技术,在不需要多线程运算时,可令闲置核心完全关闭。各个核心可以工作在不同的电压/频率下,单独提高某一核心频率的Turbo Mode模式可显著提升单线程应用性能。
  Intel还同时发布了首款6核心处理器,针对多路服务器市场的“Dunnington”Xeon X7460,内建16MB L3缓存,在2008年9月上市,是Intel在转向Nehalem微架构之前的最后一颗45nm酷睿2微架构处理器。采用该处理器的服务器机型已经打破了多项世界纪录,包括8路48核的IBM System x3950 M2服务器在TPC Benchmark C数据库测试中首次突破100万tpmC,4路系统惠普Proliant DL580 G5打破TPC-C纪录,戴尔PowerEdge R900打破TPC-E纪录,Sun Fire X4450打破SPECjbb 2005纪录,富士通西门子PRIMERGY RX600 S4打破SPECint_rate2006纪录。[3]
编辑本段无三级缓存版AMD 45nm处理器  在工艺进步、技术完善后,AMD的45nm新桌面处理器将拥有齐全的五个子系列,其中拥有三级缓存的属于Phenom II品牌,精简掉三级缓存的则仍沿用Athlon品牌(不知道为何不是Athlon II)。至于Sempron品牌,很快就会退休了。
  最高端的“Phenom II X4 900/800”系列四核心代号Deneb,二级缓存4×512KB,三级缓存前者6MB、后者精简到4MB。这两个系列都将于明年1月份率先发布,其中首批两款AM2+接口的Phenom II X4 940/920会在1月8日的CES 2009大展上首发,之后的全部改用AM3接口。
  三核心系列“Phenom II X3 700”代号Heka,二级缓存3×512KB,三级缓存为完整的6MB,将在明年2月份跟进。
  除了这两个系列,AMD还准备了没有三级缓存的版本,而且在设计之初就没有加入三级缓存,而不是简单的屏蔽版本,不会造成浪费。
  其中四核心将是“Athlon X4 600”系列,代号Propus,二级缓存4×512KB,三核心是“Athlon X3 400”系列,代号Rana,二级缓存3×512KB,二者都会在明年4月份登场。
  最后是代号Regor的“Athlon X2 200”系列双核心,二级缓存2×1MB,比其它系列多出一倍,不过发布时间也最晚,要到明年6月才会推出,目的是避免和现有的旧架构型号产生冲突。
  芯片组方面,现在的AMD 7系列主板在更新BIOS就能支持新处理器,具体视主板厂商的技术支持而定。另外AMD将在2009年上半年推出新的8系列整合芯片组,其中RS880和RS880C搭配SB750南桥,RS880D和RS890搭配下一代SB800。[4].
编辑本段一级二级三级缓存谁比较重要  一级最重要,但是现在CPU的一级缓存几乎都一样,所以忽略。
  二级缓存的话对于Intel的CPU是很重要的,Intel的CPU的二级缓存越大性能提升非常明显,而AMD的CPU虽然二级缓存也很重要,但是二级缓存大小对AMD的CPU的性能提升不是很明显。
  三级缓存其实只是做了个辅助的作用,除了服务器,其实对大多数家庭机没什么用的,内存还是很重要的,但如果运行大型程序或游戏来说三级缓存就显得重要了,目前新型CPU已经有三级缓存了。
  所以说现在衡量CPU性能除了频率外,还有一个核心数量,再到缓存的大小, 从理论上讲,二级缓存越大处理器的性能越好,但这并不是说二级缓存容量加倍就能够处理器带来成倍的性能增长。2006年,CPU处理的绝大部分数据的大小都在0-256KB之间,小部分数据的大小在256KB-512KB之间,只有极少数数据的大小超过512KB。到2009年已经有1m,2m的了。所以只要处理器可用的一级、二级缓存容量达到256KB以上,那就能够应付正常的应用;512KB容量的二级缓存已经足够满足绝大多数应用的需求。[5]
编辑本段主频、二级缓存和三级缓存哪个更重要  缓存的工作原理是当CPU要读取一个数据时,首先从缓存中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入缓存中,可以使得以后对整块数据的读取都从缓存中进行,不必再调用内存。
  正是这样的读取机制使CPU读取缓存的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在缓存中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先缓存后内存。
  cpu的二级缓存和三级缓存的大小,并不是衡量cpu的性能的唯一标准,还得看cpu的主频,制程,比如说45纳米的就比65纳米的好,还要稍微注意一下它支持的指令集,还得看是谁的产品,二级缓存对于intel的产品来说很重要但二级缓存对于AMD来说就不像intel那么重要,因为AMD除了有二级缓存之外还有三级缓存。
  要说主频、二级缓存和三级缓存哪个更重要,这个问题完全还要看你使用电脑追求什么了,主要执行什么任务。主频高运算速度快,二级缓存(L2)和三级缓存(L3)起到内存和CPU之间的缓冲作用,缓解内存和CPU速度不匹配问题起到提高CPU执行效率。所以大L2、L3在CPU长时间大量数据处理的时候效率会比较高。高主频在短时间内少量数据的处理上会比较快,其实3项这都很重要 ,哪一项达不到一定标准都会出现瓶颈效应。[5][6]
编辑本段IntelXeon 7100系列CPU(16MB三级缓存)  Intel正式发布了针对高端服务器的最新双核Xeon处理器,代号Tulsa的Xeon 7100系列。该处理器依然基于上一代NetBurst架构,但在性能和功耗表现方面都有不小的改进。Xeon 7100系列CPU配置  Xeon 7100系列CPU核心代号为Tulsa,双核心设计,每个核心配备了1MB L2(二级)缓存,16MB L3(三级)缓存。该处理器还支持超线程(HT : Hyper-Threading)、虚拟化(Intel Virtualization Technology)以及Intel缓存安全技术(Cache Safe Technology),3.0GHz主频以上的Xeon 7100系列处理器TDP功耗为150W,3.0GHz以下的TDP为95W。Xeon 7100系列CPU规格  CPU编号 主频 FSB L2缓存 L3缓存 千颗价格
  7140M 3.40GHz 800MHz 2×1MB 16MB 1980
  7140N 3.33GHz 667MHz 2×1MB 16MB 1980
  7130M 3.20GHz 800MHz 2×1MB 8MB 1391
  7130N 3.16GHz 667MHz 2×1MB 8MB 1391
  7120M 3.00GHz 800MHz 2×1MB 4MB 1177
  7120N 3.00GHz 667MHz 2×1MB 4MB 1177
  7110M 2.60GHz 800MHz 2×1MB 4MB 856
  7110N 2.60GHz 667MHz 2×1MB 4MB 856
  Xeon 7100系列处理器支持667和800MHz PSB总线,与8501芯片组兼容,现有的服务器平台可以很轻松的升级到新处理器。此外Intel公司表示,65nm工艺发展的十分顺利,目前65nm产品的出货比例已经超越90nm。[7]



参考资料
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

联系我们|手机版|小黑屋|Archiver|电脑互动吧 ( 浙ICP备13037409号 )

浙公网安备 33032402001025号

GMT+8, 2024-11-23 02:50 , Processed in 0.381075 second(s), 18 queries .

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表