您好, 访客   登录/注册

普及真6核AMD Phenom Ⅱ x6 1090T详细测试

来源:用户上传      作者: 现代计算机评测室

  从CPU的发展历史看,处理器由指令优化。微架构改进,频率的提高、再到现在的多核时代。CPU历经了不少的变革和潮流,随着摩尔定律的逐渐失效,处理器正向着多核,并行计算以及异构计算的方向不断发展。
  现在三核、四核渐成主流时,六核更悄悄地进入了桌面市场的视线。AMD近期发布的6核LEO平台凭借着高性价比的优势,矛头直指价格虚高的i7平台。那么,AMD发布的原生6核Phe-nom Ⅱ x6相对于价格相当的i7四核处理器又有何优势?下面我们通过分析,测试AMD的6核Phenom Ⅱ x6 1090T来逐步探讨原生6核和4核8线程的i7处理器之间性能差异。在主板上配搭上,890FX系列的主板都可以完美地支持AMD Phenom Ⅱ x6系列处理器,同时其他兼容AM3的主板也可以通过刷BIOS等方式来支持AMD最新的6核处理器。
  
  Phenom Ⅱ X 6处理器
  
  不久前Intel发布的旗舰6核980X,凭借着高端的定位让它一度受到了关注。不过高高在上的价格,使它受到市场的冷落。在某种意义上,980X更像是一种象征,一般用户注定了与它无缘。现在AMD发布的Phenom Ⅱ X6却拥有可接受的价格,型号方面包括了1090T、1075T1055T和1035T等。其中市场价格大约在1000到2300元之间,因此达到了一般高端用户接受价格。
  
  谈桌面多核心发展历程
  在K8时代,AMD的原生双核曾经辉煌,凭借它内置内存控制器和HT总线把Intel的Netbrust远抛在后。直到酷睿架构的诞生,相对于前代架构,酷睿架构为多核优化带来的是共享二级缓存机制。我们知道当时Netbrust架构的奔腾D通过FSB仲裁来达到双核心通信的,这样就造成效率低下。
  在经过不同多核心微架构的变化里,限制多核性能的有多个方面。其中共享缓存就是一个重要因素。AMD的K10架构是首次使用4核心共享3级缓存的设计,另一方面Intel直到Nehalem微架构的诞生才正式使用4核心共享缓存机制。
  共享缓存机制使得核心间的通信可以通过高速的片上存储器实现,这对并行算法有很大的帮助。在处理器模型上这类处理器称为对称共享存储器模型。除此之外,限制多核性能的还有总线技术。从前端总线技术到AMD推出的超传输总线(HT),再到现在应用在Nehalem架构上的QPI总线。由于核数量的不断提升,内核对RAM以及外部I/O的传输带宽的需求在不断地提高,因此总线技术在多核系统中发展十分迅速。
  Intel的Nehalem架构上又重新把以前奔四时期的超线程技术用上,因此支持超线程的i7拥有4个物理核可以同时实现8个线程,效率上有一定的提升。
  
  浅析Phenom Ⅱ x6架构
  Phenom Ⅱ x6延续K10微架构的特征,每个核心分别拥有独立128KB的L1和512KB的L2。其中所有核心将共享6MB的3级缓存。对比Intel的Gulftwon核心,980X则拥有12MB缓存。当然,共享缓存越多并不一定代表性能会线性增长,不过在大量的密集运算中,如果出现大范围的缓存命中则对性能有极大的提升。
  从架构上看,AMD Phenom Ⅱ x6依然采用HT传输标准,内置内存控制器,支持DDR3双通道传输。当中产品的名为1000T,其中T代表支持AMD的Turbo Core技术。AMD的Turbo Core可以让核心数根据不同负载而作出不同的调整,下面我们会对其做深入的分析。
  小知识:
  超线程(逻辑核)和真物理核的区别:超线程技术是应用硬件指令来把一个物理核模拟成为两个逻辑核,从而得到性能的提升。但从深层次看,超线程技术其实是类似干线程间指令的乱序执行。一般处理器当中的乱序执行是同一线程的乱序指令,但是当某一线程的指令流也不能同时用完流水线当中的所有硬件单元的时候,就会有一些闲置。超线程技术就是同时运行两个线程,尽量把流水线当中的硬件资源用满,以达到更高的效率。
  而真正的物理核是一套拥有完整流水线和硬件模块的核心,它具备内核拥有的所有功能,当然,真正的物理核心效能会高很多,但是缺点就是硬件成本高。
  
  第三代3A平台LEO
  
  2010年Windows 7操作系统所推动的多核处理器加图形处理器的从新定位,在微软在操作系统层面上提出了GPU+CPU的应用模型。相对于这个融聚的未来,AMD推出了她的第三代3A平台LEO。AMD在成功并购ATI后,成为业内唯一一家能够同时提供处理器,图形显示芯片,主板芯片组的全平台厂商。因此推出3A平台是理所当然的事情。当时第一代平台Spider以AMD Phenom处理器AMD 7系列主板和ATI Radeon HD3800显卡为标志。
  随着ATI Radeon HD4000系列的王者归来以及全新Phenom Ⅱ处理器的发布,AMD便把3A平台更进一步,推出了第二代3A平台――Dragon平台。
  
  狮子(LEO)
  2010年4月28日,AMD正式推出了新一代旗舰平台AMD“LEO”平台。其中,包括AMD Phenom Ⅱ x6处理器+AMD 800系列主板+ATI Radeon HD5000系列显卡所组成的顶级配置。
  在LEO平台当中,最突出的就是多核(六核)处理器加上性能强大的图形核心,微软在win7推出的时候就表明了今后操作系统的应用模型,迎合并行计算应用的发展和用于大量需求。在通用技术上面,NVIDIA有CUDA,AMD也有自己的ATI Stream,因此强大的多核处理器配上显卡的通用能力是未来发展的潮流。
  现在双核,4核大行其道,同时在视频转换以及音频编辑都得到很好的多核的优化。一般家庭用的多核处理器已经具备较强音视频处理能力。而AMD发布的六核系列更是把家庭应用的体验推向高峰。
  
  Turbo Core技术
  TTurbo Core技术是支持多个核心动态调节核心的电压,频率。可以让CPU在最大TDP功耗之内对不同工作状态的核心进行调节。当应用程序对多核优化得比较好的时候,Phe-nom Ⅱ x6的6个核心会同时运行在默认频率,这时Turbo Core并不会启动。而一些软件对多核心CPU优化不好的时候,其中芯片会把内核中的3个核心的频率提高400~500MHz,另外的3个核心就降低频率至休眠状态。不过这里是和INTEL的Turbo boost有区别,Turbo Boost的是支持单个核心的超频以及其他核心的关闭。但是AMD的Turbo Core支持3“上”3“下”的策略,对于多核有更好优化的windows 7操作系统来说无疑更有优势。

  Turbo Core技术是通过硬件底层实现的,无需用户干预。当运行的程序使用不了处理器当中的所有核心时,处理器就会让其中的3个进行超频,做到提高串行执行的效率。
  
  测试平台以及相关硬件介绍/赏析
  
  测试上我们采用Phenom Ⅱ x6 1090T对比Intel的Core i7 930,由于它们俩价格比较接近,因此作为参考性对比。主板配搭上,AMD平台使用的是微星890FX,Intel平台配搭的是X58主板。
  测试主要是系统性能测试,3D性能基准测试,CPU运算能力测试以及实际游戏的性能。
  
  CPU效能测试
  
  CPU常规测试主要是考察处理器的运算单元,片上缓存以及CPU内存子系统的性能,由于一般用于测试的应用软件对多核以及多线程都有极好的优化,因此可以把其作为一个类似理论值来参考。从测试性能可以了解到不同架构的处理器所拥有的最大性能。当然,这个只是参考值,等到实际的应用效率就要靠程序开发者自己的“功力”了。
  一般处理器模型中,有极好的理论峰值性能,但不一定拥有很好的实际应用性能。现在多核处理器几乎都采用对称性共享存储式的设计,所以开发的技巧没太大区别,性能的差异主要在处理器的微架构当中表现。虽然Nehalem微架构较有优势,不过同价位当中拥有更多物理核心的AMD Phenom Ⅱ x6拥有先天的优势,只要程序对多核优化较好,性能就会有意想不到的提升。
  纵观现在的软件应用,对多核优化较好的是3D渲染/建模,科学计算、音视频处理等。而一般日常的应用则对多核优化的力度并不大,到现在为止,一般应用程序都可以应用到双核心,但是在4核以及更高的核心数时候往往并不能发挥多核心的优势,不过将来的发展趋势无疑是多核应用。
  基于以上原因,所以AMD和Intel都分别提出了自己的Turbo加速技术。通过提高特定处理器的频率来提高某些对并行优化的不好的程序。除了程序的优化之外,操作系统的支持也十分重要,现在大多数主流的通用操作系统都对多核CPU有良好的支持,可以通过多种算法以及不同的复杂策略来达到CPU核心间负载的平衡。
  本次的测试软件主要是考量CPU的运算单元以及CPU缓存效能,CPU内存子系统效能以及多核效能等方面。
  
  Sisoftware sandra 2010 SP1测试
  SiSoftware Sandra(the System Analyser Diagnostic and Report-ing Assistant)是一套功能强大的系统分析、诊断、测试和报告工具,包括众多的分析与测试模组。我们测试使用的是2010 SPI版本,测试的项目主要选择CPU性能相关的项目。
  
  Fritz Chess Benchmark测试
  Fritz Chess是一个国际象棋AI的测试工具,软件支持多线程工作,运行每个核心的使用率均达到100%,可以较好地反映CPU的多核效能。软件计算的结果是CPU每秒运算的棋步数量。
  
  wPrime(越小越好)
  wPrime是一款测试x86处理器性能的Benchmark,它主要通过计算超高精度的平方根来测试处理器效能。该软件对多线程进行了良好的优化,因此十分适合测试多核处理器的效率。软件中得出的数值是时间(秒),数值越小越好。算法方面,软件使用牛顿切线法来循环迭代逼近,所以运算量十分巨大。
  
  压缩测试
  测试方法是采用压缩工具7-zip自带的测试来进行考量。测试成绩可以很好地反映多核效能。
  
  MedieCode视频转换应用(时间越小越好)
  视频转换测试中,我们使用功能强悍的视频转换软件MediaCoder,测试的方法是转换一部高清片头(特种部队)为预定格式。原始编码为H.264,码率为17Mbps、大小65MB长32秒。目标格式为MP4,码率为1Mbps。测试用软件自带性能测试。在测试当中,我们发现软件对多核的支持,在转换的过程中CPU的核心使用率达到100%。
  
  3D渲染应用:CINEBENCH R11.5测试
  CINEBENCH使用针对电影电视行业开发的Cinema 4D特效软件引擎,可以测试CPU和显卡的性能。在测试中我们设置为CPU渲染模式,以便考察处理器的效能。
  
  TrueCrypt加密测试
  TrueCrypt是一款免费的软件,它可以在硬盘上创建一个或多个虚拟磁盘,所有虚拟磁盘上的文件都被自动加密,需要通过密码来进行访问。True-Crypt提供多种加密算法,如AES-256,Blowfish(448-bit-key),CAST5、Serpent、TripleDES等。测试设定上面我们采用软件内置的Benchmark工具,测试数据设定为500MB。
  
  3D基准测试
  
  基准测试上采用测试DX10性能的3DMark Vantage以及DX11接口的Heaven Benchmark2.0。在测试中,可以较为全面地了解到处理器在DX10/11 3D应用中的效能。在3DMark Vantage当中就有具体的CPU测试,它可以测试CPU的物理加速和AI效能。
  由于CPU在3D渲染当中起到主导的作用,它就相当于一个中心的控制作用,所以如果CPU效能过低,就会导致GPU的3D性能得不到良好的发挥。在Win7上面,微软就大力提倡应用在DX11上的多线程技术,可以通过多线程处理协调高负荷的3D渲染,让DX11的效能更进一步。
  在基准测试的Haven Benchmark测试就是采用DX11技术的Demo,它应用了强大的曲面细分技术。其中在草皮的模拟以及烟囱的烟雾也会消耗大量的CPU资源。
  
  3Dmark Vantage测试(DX10)
  鉴于本次测试主要测试CPU成绩,因此把测试级别跳到Performance。
  
  Heaven Benchmark2.0测试(DX11)
  测试设置上我们采用1980×1080分辨率,Sharder调到高,Tessellation设置为Normal同时关闭抗锯齿。
  
  游戏测试
  
  CPU和显卡几乎决定了游戏的性能。一块高端的显卡,要配上一颖强劲的CPU才能发挥到的最高效能。因此我们加入了游戏测试。现在越来越多的游戏对双核心提供支持,所以双核在游戏中的使用率会比较高。在4核、6核等多核心方面虽然有游戏可以应用到不同核心的资源,但是总体的CPU使用率不高。
  在测试游戏的选择上我们采用时下对GPU和CPU要求较高的主流游戏同时选择了DXIO游戏和最新的DX11游戏作为参考。

  
  《孤岛惊魂》(自带Benchmark)
  测试设置分辨率为1980×1080,画质调到veryhigh同时关闭抗锯齿,
  
  《孤岛危机:弹头》(自带Berichmar-k)
  孤岛危机测试当中我们采用了3个Benchmark场景,画质设置上为Garner、分辨率设定为1920×1080,同时关闭抗锯齿。
  
  《战地:叛逆连队2》测试
  叛逆连队2没有内置Benchmark工具,测试采用的环境是第一关渡轮中的过场画面,同时用软件记录平均帧数。
  
  《尘埃2测试》(自带Berichmark)
  尘埃2测试画质调到最高、分辨率为1920×1080,关闭抗锯齿。
  
  《地铁2033》测试
  地铁2033是一款对显卡性能有极高要求的游戏,它支持DX11以及物理加速。在DX11中可以打开Tessellation特效。在测试工作中发现地铁2033在veryheigh下面显卡性能下降得十分厉害,可谓是一款新的显卡杀手!
  测试方法上,由于游戏不带内部测试,因此笔者采用了第一关首次遇到汽车时的非玩家控制场景录制帧率,同时计算平均值。
  游戏设置为1920×1080分辨率,开启DX11效果、开启曲面细分,画质调到高。
  
  功耗测试
  
  功耗测试中我们采用不同负载来体验,其中测试了单线程以及多线程时的功耗,在模拟3D满载上,我们使用Furmark做烤机测试。
  
  性能总结
  
  从测试当中,我们可以看到四核八线程的i7 930与六核心的Phenom Ⅱ X6 1090T互有优势。在一些并行度较高的测试上可以看到AMD的六核心Phenom Ⅱ x6 1090T拥有较好的性能,特别是多媒体性能和高清娱乐方面,均能大幅超越4核8线程的i7930,这得益于AMD多出了50%的核心数目,同时也证明了Intel超线程技术在很多应用层面不如物理多核来得实在。不过我们也会看到在串行依赖比较强烈的测试当中i7 930也体现出了一定微架构的优势。功耗方面两家的处理器都控制得相当出色,特别在CPU空闲的时候功耗控制得比较好。AMD的6核在空闲状态下测得88W的功率,当然这得益于CPU和HD5870的动态功耗调节。
  
  CPU性能总结:高负载应用多核优势明显
  在整型指令浮点指令以及双精度指令的测试上AMD的Phenom Ⅱ X6 1090T明显占到很大的优势,同时在算数指令和多媒体测试方面也体现了巨大领先。
  视频转换上面和加密测试当中,由于可以很好地做到并行处理,因此拥有6个物理核心的1090T拥有不少的优势。CPU的3D渲染测试里面
  同样优化得十分出色测试的性能几乎和核心数成线性相关的变化。
  
  3D性能总结:多核游戏是未来主流
  CPU在图形性能的地位是举足轻重的,在游戏测试中,当实际的场景要用到大量的物理模拟以及AI运算的时候,游戏的帧数就会出现下跌的现象。同时在实测的过程中,我们发现即使是现在比较顶级的开发团队所写的游戏,在对多核心的支持上仍然不太理想。在额外的物理场景测试当里面,我们建立了大量的爆炸体,目的是提高物理运算的密度,不过在观察CPU使用率时,发现处理器还是处于中低负载状态。
  从测试结果可以看出DX11的游戏对多核心的支持比较优秀,这得益于微软在DX11中应用了多核心支持技术。对处理器要求较高的游戏一般都是拥有大量复杂的物理效果以及AI模拟。譬如基于DX11的《战地:叛逆联队2》它的的90%以上的场景都可以破坏。又如新一代显卡危机――《地铁2033》对GPU要求极高外对多核心的优化也是比较出色。Phenom Ⅱ 1090T凭借着6个物理核心在这一环节中取得了明显优势,即使相对拥有8个线程的i7 930来说,也完全体现出了高负载效能。
  
  竞争力非凡:Phenom Ⅱ x6 1090T领先不少
  在测试当中,拥有多50%核心的1090T对比Core i7 930的确有一定的优势。这主要表现在3D渲染,密码算法等一系列对并行优化极好的应用上。游戏方面则互有领先,缓存较具优势的i7在一些游戏当中性能还是比较突出。不过一些对多核支持十分出色的游戏里1090T便如鱼得水。其中较为突出的是基于DX11的《叛逆联队2》和《地铁2033》,显现出了多核的优势。对比AMD和Intel平台,我们会发现AMD的主板对Phenom Ⅱ X6有较好的兼容,用户一般不用另外升级主板,可以在以往兼容AM3的主板上支持拥有性价比和多核优势的6核CPU,反观Intel把平台的接口划分为高端的1366和主流的1156接口,这对中间阶段的消费者来说比较尴尬,消费者怎么升级都得多花一块主板的钱。
  
  最后:多核应用是趋势,并行优化最难点
  CPU已经向4核乃至6核发展,不过使用的用户不多,一般集中在工业应用和高性能行业上,现在的家庭应用还停留在双核优化上,多核的优化还在不断改进当中。在本次测试当里笔者发现即使游戏使用了多个核心,每个核心的使用率普片不高,一般在30%`60%间。
  基于这状态中即使可以用到多个核心但是每个核心的使用率都不高,所以效能上会低于使用高频的少量核心。
  编辑点评:在OS上支持多核一般是采用轮转算法,如果为了要使用多核而不断轮转程序到不同的处理器上,虽然可以有效地平衡多核的资源,但是核与核之间的线程上下文切换开销较大,导致效率低下。所以一般优秀的调度算法。要考虑到相关性较强的指令段保证在同一个内核上执行,而相关性低的分配到不同的内核上执行。
  在win7中,操作系统将从以往的多核运算提升到了另一个高度。即众核以及异构运算(CPU+GPU模型)。结合多核优化以及NVIDIA CUDA,ATI Stream、DirectX Compute和OpenCL等通用运算技术,操作系统将为用户带来强大的应用体验,同时强大的硬件资源也可以得到高效的应用。
  相信读者看了测试后还有不少疑问,到底多核优化为何难?怎样对多核(众核)进行优化?我们将在近期结合比较成熟的通用运算技术为读者进行详细的分析、敬请留意。


转载注明来源:https://www.xzbu.com/8/view-1084598.htm