显卡能效比-难言之隐只有难言没有“之隐”
最近更新时间:2025-10-26 原创
前言
衡量一款芯片是否优秀,如果只能选一个指标,站长认为,CPU是“IPC”,显卡是“能效比”。
CPU每次官方新一代产品的发布会,经常把“IPC”提升幅度大势宣传一番,但是,轮到显卡新品发布会,英伟达和AMD都不公布能效比数据,这其中有什么难言之隐吗?
今天,站长就给大家解密。

正文
能效比之所以是“最重要”的指标,是因为它是显卡的:制程、GPU核心规模、GPU架构、GPU频率、显存规格和驱动全面优秀的综合表现,这点像高考总分,“语数外物化生”,看的是“六门科目总分”。
好巧,影响能效比的恰好也有六个主要因素。
1、 制程。
以RTX50和RTX40为例,分别采用TSMC 4NP NVIDIA定制工艺和TSMC 4N NVIDIA定制工艺,晶体管平均密度相当,大约1.2亿/平方毫米。制程上两者算一个层次。

此图来自于笔吧评测
2、 GPU核心规模
从上图看出,移动端能效比RTX5090>RTX5080>5070ti>RTX5070,体现了同制程和架构下,核心规模越大,能效比越高。
对比RTX5080和RTX5070TI,核心规模(CUDA核心)提升了30%,能效比提升了13%(140W)。 但此结论不适用桌面端。在桌面端能效比最大值出现在RTX5080。

经统计(见上图),从10到50系列,桌面端的能效比最佳分别是:GTX1080、RTX2080TI、RTX3070、RTX4080S和RTX5080,最近两代都是次旗舰型号。这或许能说明,在技术允许前提下,核心规模可以往上堆,直到能效比下降再停止。
考虑到40和50系列移动端旗舰版的规模都低于同级桌面的次旗舰,
可以推论: 在移动端,档次越高,能效比越高。
3、GPU架构
移动版RTX5080和RTX4090的能效比曲线在110~160W区间几乎重合,RTX5080的CUDA数量是8192个,比RTX4090是9728个少16%,这说明RTX5080依靠架构和显存两方面的优势,用相同的功耗,和核心规模更大的RTX4090性能打平,也可以说RTX4090依靠更大的规模,弥补了架构和显存的劣势。
那我们可以直接计算50架构的能效比提升幅度吗? 不能,因为流处理器变化了,能效比也会变化。 但是,可以计算每流处理器能效比(忽略频率因素)
过程——
设:A为RTX5080的每流处理器效率因子,流处理器数量和跑分成正比(注:仅在一定区间内适用,需满足多个条件,这里不展开讨论)
由于两者在140W跑分一样 则有:9728=8192A
A=1.187
即:在140W时,RTX5080比RTX4090的每流处理器能效高18%,这是“架构和显存双提升”带来的增幅。

4、GPU频率
不同的显卡,基础频率和加速频率也不一样,GPU频率是研发公司综合考虑性能、功耗、散热条件、自身定位、产品竞争格局等多因素的最佳平衡点。
一般来说,桌面版显卡进行手动超频,如未进行降压,能效比会降低,移动版一般通过降压来实现频率提升,能效比升高。
5、 显存规格
显存功耗在整卡功耗中的占比不是一个固定值,在桌面端典型功耗占比大约10~20%,移动端为15~25%。采用能效比更高的显存,移动显卡的获益高于桌面显卡。
仍然以RTX5080和RTX4090为例,前者是16GB GDDR6,带宽是576GB/s,后者是16GB GDDR7,带宽896GB/s,增加幅度为55%。
根据目前资料,GDDR7的能效比相对GDDR6提升了50%以上。
由于:显存能效比=带宽/显存功耗
如果按55%计算,那么意味着,RTX 5080移动版在提供高出55%带宽的同时,其显存在典型负载下的功耗与RTX 4090移动版大致相同,其“能效红利”并未节约功耗,几乎完全被转化成了“性能红利”。
6、 驱动
常用:显卡能效比=跑分/平均功耗。 显卡的跑分和驱动有关。由于3DMark测试项目(如Time Spy, Steel Nomad等)对显卡压力的侧重点不同,驱动更新后,不同的项目提升比例也不相同。

总结
CPU没有传统驱动程序,我们能固定在八核、4GHz来公布IPC提升比例,显卡却难以固定在相同的流处理器数量来对比。所以,文中我们只能粗略计算“每流处理器能效比”。新一代的显卡发布,不公布能效提升幅度,其中没有“”之隐”,只有“难言”,因为它缺乏公平的对比基础,又是动态变化的数据,受影响的因素太多,难以给出一个固定的提升比例。
«上一篇:CPU是“3”,GPU是“3+2”,英伟达是3+2=1




从1060到5060都说能效提升了,可功耗提升都挺大的。