amdintel服务器性能差异,高频比多核重要?浅析为何AMD游戏性能干不过Intel

2006年石破天惊的一声巨响,Intel给我们送来了酷睿系列桌面级处理器,转瞬之际游戏应用市场江山易主,游戏玩家们都是十分现实的,说谁是谁的粉丝那只是场面话,最终还是谁强就用谁的。

时间如白驹过隙,转眼来到2020年,Intel再一次举起"10"破天惊的大旗,第十代酷睿处理器将主频推上前所未有的高峰,呼应了14年前的壮举:我们稳稳地坐在游戏性能的王座上。

667fe0c88a58ad5cb4fff08e01cdd2ef.png

在酷睿横行天下的时代,AMD陆续开发出基于K10架构的羿龙系列、推土机、打桩机等多款产品予以反击,但都收效甚微,直到2017年初终于拿出了具有竞争力的产品——锐龙系列,光复失地迎来了一线曙光。

至此,在桌面级应用领域,Intel与AMD走向两种不同截然不同的道路。前者似乎从一开始就对堆叠核心数目不感兴趣,而是不断优化提升其频率能力。后者虽然在台积电的帮助下用上了7nm工艺,但频率能力却一直捉襟见肘,转而不断增加核心数量。像3950X(16C/32T)这种原本应属于HEDT平台的规格,在锐龙3000系列中AMD都将其放到了消费级平台上。

我们不否认像图像渲染、视频编辑等设计工作需要仰仗大量的并行计算,多核心具有优势,但桌面级平台毕竟不是服务器,终究还是要为普通用户服务的。在游戏领域,即便如DX12这样对CPU多线程充分优化的API环境,8线程几乎是游戏能利用的极限,大部分游戏的CPU利用率都低于这一数目。

当更多的核心无用时,频率就是影响游戏性能的关键了,其中还包括更深层次的因素——"时钟效能"。

64856c4b01e105cc008af1f10739a41b.png

如上图所示,这是AMD刚刚发布的Ryzen 5 3600XT处理器与Intel 10代酷睿i5 10600K的游戏帧率对比,同定位的竞争AMD又一次完败了。

在游戏实际应用中,到底是哪些因素造成了两者游戏性能的差距,相比核心数量,频率到底有多重要,是时候给大家仔细捋一捋了。

鲜为人知的真实频率差距

我们以锐龙的R9 3900X与酷睿的i7 10700K为例进行对比。

首先,前者定位高于后者,但两者价位相同,符合广大游戏玩家以价格为导向的性能对比方式。其次,3900X为12核24线程,最大加速频率4.6GHz;10700K为8核16线程,最大加速频率5.1GHz,前者比后者的核心线程多了1/2,后者最高频率则比前者多了500MHz。

cdf22c5bc813bee23829b88d7ec27768.png

资深玩家都知道,游戏对CPU频率的需求不是无限的,它以满足显卡渲染速度为前提,即便3900X的频率落后500MHz,按理说达到4.6GHz也不至于产生明显瓶颈。

但这仅仅是表象而已,许多人只知其一不知其二:AMD与Intel的真正的频率能力差距远不止这500MHz。见下图:

对3900X和10700K运行Prime95以模拟游戏中可能遇到的重负载环节,再来看它们的主频差距。

e13f760dba943cc7f698418d3e4f53f1.png

号称最高加速4.6GHz的3900X,遇到重负载直接降频到3.8GHz

6bf1db64670e6123c1021bf34edab5b2.png

同样负载下,10700K最低也有4.8GHz,而且其中有两核心还能坚持5GHz

也就是说,3900X与10700K的主频在实际应用在中的理论最大差值达到1.2GHz之多,这可不是个小数目,用通俗的话讲就是"Intel的主频比AMD更能扛",不要被纸面数据给骗了。

以上频率差距在实际游戏中能造成多大影响?《三国:全面战争》是一款对CPU负载较重的RTS游戏,游戏场景中数量庞大的作战单位对CPU算力消耗极大,能充分说明问题。

3d135b030490eb20d591aef437f782db.png

几乎没有其它3A游戏大作对CPU的要求比《三国:全面战争》更高了

747bfe29e132b6e24257cc8e70c821d0.png

使用同一片RTX 2080Ti显卡,两个场景下3900X比10700K均少了15fps左右,何况前者还比后者多了4核/8线程。

由此可见,在线程数量能够满足游戏需求之际,考验的是每颗核心的算力,多出来的核心是无用武之地的。游戏中CPU承担的建模、AI计算并不是像视频压缩或图像渲染那种单一短指令,且由于即时演算的要求,并行计算的规模与输出速率也绝不是简单的1+1=2的关系,游戏的应用程序接口不可能将这些复杂指令的工作无限制的分配到多线程上以提高它们输出到GPU速率。

说的简单一点,就是规模≠速率

62faf4dc42469511946731ad6fa53e26.png

同样的生产任务,完成需要的总时间相同,速度快的流水线可以更早得到成品

举个形象一点的例子,好比工厂里生产汽车的流水线,一台车下线的速度取决于这条流水线的效率,而与流水线的数量无关。如果我必须在中午得到一台车,而流水线生产一台车却需要一整天,那么再多的流水线也无济于事。这就是即时演算所强调的"低延时"与并行计算所强调的"单位时间算力"最大的区别。

游戏需要的是即时演算,是将玩家做出的每一个操作,场景中的每一个变化,以最低的延迟反馈到显示器上,如果在这方面能力欠缺,即使单位时间算力再大也不会对游戏帧率有什么帮助,黄花菜都凉了。

被频率掩盖的时钟效能

接下来我们要从更深层次来探讨Intel与AMD游戏性能差别的原因。下面这个测试之前可能很少有人尝试过,它有非常大的参考价值和说服力。

如果说频率的优势使Intel的游戏性能始终领先AMD,那现在假设这个优势没了,两者频率完全相同,核心线程数量一致,前者还能保持优势吗?

cf1d134620395fdce2d27e832d53eb4c.png

将10700K与3900X主频手动到设置4.2GHz,8核心16线程

在这轮对比测试中,关闭AMD Ryzen9 3900X的4个工作核心,变成和Intel Core i7 10700K相同规格的8核16线程。之所以要选择3900X而非3700X,是因为3900X内核为双CCD,内存写入不会减半,从而实现与10700K的内存对等发挥,从理论上创造一个公平环境。

9ec16d3fc31741ee4b24b5bf984db84a.png

CPU性能差距往往体现在百尺竿头,我们特地选择了7款自带Benchmark的游戏测试,确保测试路径和场景绝对一致。结果依然是Intel的全面胜利,AMD基本没有拿到得分点

相同的核心频率,相同的核心数,相同的内存频率,锐龙依然完败,这体现了一个残酷的现实,即Intel CPU架构的IPC明显强于AMD。

IPC,英文全称"Instruction Per Clock",中文翻译过来就是每个时钟的指令,即CPU每一时钟周期内能执行的指令有多少,亦简称作时钟效能。IPC代表了一整代CPU的设计架构,通常一旦该设计完成之后,IPC值就不会再改变了。所以CPU每个核心的性能不光取决于频率,IPC的高低才是决定性的因素。

相信资深的硬件玩家也可以通过其它方面感受到AMD与Intel在IPC上的差别。比如锐龙至今颗粒无收的SuperPi测试,比如单、双精度浮点测试,这些都是体现IPC最直观的理论测试。自酷睿诞生以来,AMD从来没有在任何一项此类测试中望Intel之项背,而游戏性能往往就取决于此。

不能忽视的可靠性差别

任何设备都有一个重要性不亚于性能的指标:可靠性。最后说一说这个问题。

可靠性是一个统称,它通常包括兼容性、易用性、耐用性、极端条件下的稳定性等诸多范畴。对AMD处理器而言,在可靠性上面临的挑战可能不亚于频率性能——这绝不是刻意贬低,相信只要你长期使用锐龙平台并且玩的游戏够多,一定深有体会。

在我们这次测试过程中,AMD平台就遇到了一些可靠性问题:比如3900X无法启动DX12模式的《无主之地3》,《地铁:离去》能正常进入游戏但无法启动Benchmark,游戏运行中莫名崩溃等等。Intel平台这方面则表现出色,全部测试过程没有出现游戏无法启动或者崩溃的现象。

处理器的可靠性只有针对软硬件环境,在架构底层设计和工艺制程上经过旷日持久的打磨才能得以改善,非一朝一夕。

81b17c51b064114e95ecf863b780efca.png

AMD Ryzen9 3900X无法启动运行《无主之地3》DX12模式

65b503edf3f52946cfddf9fd35fd9923.png

AMD Ryzen9 3900X能够进入《地铁:离去》游戏但无法运行Benchmark

本文笔者已经尽可能避开了晦涩难懂的技术细节,用最直观的游戏和软件测试对比向读者阐述了在游戏领域Intel酷睿平台一直都牢牢掌握着绝对优势。在此可以十分负责地下一个结论:如果你主要是为了玩游戏去选购CPU,那么Intel平台绝对是你无悔的选择,或许它会贵一些,毕竟一分钱一分货。