当前位置:神舟问>百科问答>GPU炼金试验室 GK110核心/显存关系解密

GPU炼金试验室 GK110核心/显存关系解密

2023-06-28 10:03:54 编辑:join 浏览量:634

GPU炼金试验室 GK110核心/显存关系解密

2013年初,伴随着GK110的到来,完整的Kepler架构终于正式亮相了。对于Kepler架构,我们可以把它看做是一个从118到560平方毫米的庞大芯片家族,同时也是显存位宽“花样”最多的芯片家族。我们知道,Kepler架构通过显存位宽进行的市场细分要多于对手,那么这是不是说明Kepler是一个对显存依赖度极高的架构呢?而显存带宽对于Kepler架构又意味着什么?下面,我们将通过对GK110、GK104以及GK106的测试,来为您解答上述疑惑。

GK110核心/显存关系解密

Kepler架构是否“适宜”?显卡是一个将运算和缓冲结构合并在一起的复杂体系,其运算结构尤为复杂。硬件渲染过程会被划分成多个不同的步骤并交由GPU内部的不同部件去完成,无论几何处理、光栅化、材质操作、Pixel Shader还是最终的输出,任何一步执行的快慢都会对显卡的最终性能产生影响。如果要细化的去探讨每一个细节,我们很有可能会迷失在一片由细节构成的混沌的迷宫当中。所以,我们决定暂时略去过多的细节,先将纷繁复杂的GPU逻辑架构看成一个不可划分的整体。

复杂的流水线以GPU作为整体来讨论的话,显卡可以被分成负责运算和操作的核心,以及负责为运算以及操作过程提供缓冲的显存两个部分。而决定这两个部分性能表现的要素,也就可以被相对简单的转化成频率这一直接表征要素。

对于一颗GPU核心而言,更高的频率意味着更大的运算能力,意味着同样的任务将可以被更快的执行完毕。而更高的显存频率则意味着显存体系可以提供更大的带宽,并且更好的为GPU的运算和操作过程提供缓冲。对于一块“搭配适宜”的架构,或者说非显存依赖性架构而言,GPU核心运算能力增长应该总能够带来最终性能的提升。显存带宽的提升对于这样的GPU架构而言应该是锦上添花而非雪中送炭,甚至在某些特定的频率范围内,显存带宽的提升将可能无法被转化成直接的性能提升。

GeForce GTX 780架构图简单来说,就是“如果超核心所带来的性能提升大于超显存所带来的提升,同时超显存可能还会遇到没什么性能提升的时候,那这就是款非显存依赖的架构”。所以如果想要回答前页中的那些问题,我们要做的事其实就是观察不同核心及显存频率下显卡的性能。

基于这样的原则,我们决定设计如下实验过程:以测试显卡的默认核心频率(以下简称CC,Core Clock)及默认显存频率(以下简称MC,Memory Clock)为基准,以10%为频率调节幅度,对不同核心/显存频率的显卡性能进行测试。在将核心频率从90%调节至120%的同时,我们分别将显存频率在特定核心频率状态下从80%调节至120%,由此便产生了共计20组不同的核心及显存频率搭配方案,以及与之相对应的20组性能测试结果。

NVIDIA Inspector

(Titan+320.39驱动视角)以我们今天测试的GeForce GTX 780为例,测试产生的第一组数据为“90%CC+80%MC”,其含义为90%默认核心频率搭配80%默认显存频率。公版GeForce GTX 780的默认频率为863/6008MHz,此基准频率便是CC+MC搭配方案的频率,而90%CC+80%MC数据组的频率即为777/5408MHz。相对应的,最后一组120%CC+120%MC的含义为核心及显存同时超频20%,即频率为1035/6608MHz。中间各组搭配方案,其频率皆依此规则来确定。

测试方案虽然复杂,但这样的测试过程可以带来不少好处---我们不仅可以在一个相对宽泛的频率区间(30%核心频率变化,40%显存频率变化)内观察不同核心及显存频率搭配之后的显卡性能情况,同时还能收获一个额外的副产品,那就是不同核心及显存频率提升幅度对显卡性能提升的贡献程度,这对于超频玩家来说应该算是一个不错的好消息。

本次测试的平台由Intel 酷睿i7-3960X处理器、X79芯片组主板、威刚16GB DDR3-1600四通道内存组成。

为保证系统平台具有最佳稳定性,本次测试所使用的操作系统为Microsoft Windows 7正版授权产品,除关闭自动休眠外,其余设置均保持默认。

我们使用NVIDIA Inspector软件对频率进行调节,在进行120%CC+120%MC这样的幅度相对较大的超频时,我们会将PowerLimit从默认的100%提升至106%,同时进一步提升核心的工作电压。

既然关于核心/显存与性能的关系可以直接转化成OC爱好者们超频跑分的指导意见,那么在实验数据收集环节,我们就先展示理论测试部分,即3Dmark 11的测试结果吧。

3Dmark 11 在3Dmark 11测试中,GeForce GTX 780所在的GK110架构表现出了明显的非显存带宽依赖特征。核心频率无论处在最低的777MHz(90%CC)还是最高的1035MHz(120%CC),我们让显存频率波动40%所带来的分数变化都不明显。与之相对应的,核心频率提升10%所带来的分数提升甚至超过了显存频率提升40%所带来的增长幅度。

如果您以OC然后刷新3Dmark 11名人堂的排名为乐,那么对您而言,超GeForce GTX 780的核心频率所带来的收益要明显大于超显存。

3Dmark 11测试结果显卡最终的目的依旧是游戏,不同的游戏对于显卡的前端和后端有着不同的需求,想要寻找一个能够涵盖所有游戏特征的样本出来是不可能做到的事。本着尽可能贴近全面考验显卡需求的目的,我们决定采用2560X1600分辨率,4XAA特效全开设置下的Crysis2来完成测试。

孤岛危机2 经过测试,GeForce GTX 780在全默认频率下所提供的显存带宽并没有完全“触顶”。在默认核心频率以及110%核心频率的前提下,提升10%的显存带宽是可以为显卡进一步带来可见的性能增长的,但这种增长仅止于此,如果在此基础上(110%默认显存频率)再行提升显存带宽,GK110架构将无法继续获得性能增长。另外,即便提升显存带宽能够为我们带来“可见”的性能增长,但其增长幅度依旧如同3Dmark 11测试中所表现的那样明显低于核心频率提升所带来的幅度,无论在任何频率起点上,提升10%核心频率所带来的性能增长均远远大于提升10%显存带宽所带来的增长。

Crysis2游戏帧数测试换句话说,即便是在游戏环境下,当前GK110架构及其显卡产品的默认频率配备依旧是合适的,并没有留下明显的“显存带宽依赖倾向”。

如果您是一位天天盯着3Dmark 11的超频玩家,我们刚刚获得的这些测试结果应该会让您感到兴奋。在3Dmark 11的测试中,GK110架构表现出了强烈的非显存依赖性特性,提升核心频率所带来的分数增长要明显甚至是远远大于提升显存。尽管随着核心频率的提升,GPU对于显存带宽的依赖性略有增强,但整体而言提升核心频率依旧是在3Dmark 11中取得高分的最直接手段。

对于GeForce GTX 780而言,

跑分爱好者更爱超核心此外,NVIDIA在GeForce GTX 780上部署的显存带宽已经足够充盈,在当前的默认频率条件下,这款GK110架构的显卡并没有表现出什么明显的显存带宽依赖倾向,提升核心频率依旧比单纯提升显存带宽更为有效。但与3Dmark 11不同的是,如果您想在大部分骨灰级游戏中进一步获得帧数提升,我们建议您依旧优先在核心频率提升,在对核心进行超过20%幅度的超频之后,显存带宽的重要性才会变得更加明显。

也许今天的测试结果并没有出乎太多人的意料,毕竟作为旗舰级架构,在NVIDIA为它们配置的合理的规模及频率组合方案的影响下,GK110架构的GeForce GTX Titan/GeForce GTX 780显卡均有十分出色的表现。

下一篇测试主角是GK104架构在下一期的《GPU炼金实验室》当中,我们将会来到Kepler架构争论的“重灾区”---GK104。这是一个已经发布近一年半,曾经横亘于旗舰/sweetspot之间,同时背负了“帮助NVIDIA重夺主动的功臣”之美名与“非对称显存一定有问题”之中伤的传奇架构。GK104架构对显存带宽的依赖程度究竟如何?它会不会表现出与GK110不同的结果?我们的测试能否进一步解开更多关于GK104架构的秘密?关于这些问题的答案,就让我们一起期待吧。

标签:显存,GPU,GK110

版权声明:文章由 神舟问 整理收集,来源于互联网或者用户投稿,如有侵权,请联系我们,我们会立即处理。如转载请保留本文链接:https://www.shenzhouwen.com/answer/113473.html
热门文章