RTX3090Ti黯然褪色,RTX4090/RTX4080出来“吓人”了
最近更新时间:2022-09-22 原创
在显卡世界里,英伟达和AMD一直在打仗,争夺“地球上能耗比王座”这一至高荣誉。最近的一场战争是在2020年10月29日,AMD用RDNA2(对应RX6000系列)砍翻了英伟达的安培架构(对应RTX30系列)。
英伟达卧薪尝胆,君子报仇,两年不晚。
2022年9月20日,英伟达在秋季GTC大会上,正式发布RTX40显卡,宣称能耗比翻倍提升,这是什么概念?
对CPU来说,其灵魂是IPC,每一代提升20%都属于“吓人”的进步。(一般情况提升5~6%)
对显卡来说,其灵魂是能耗比,提升30%要把人吓一大跳,提升50%会吓得人血压飙升,提升100%会吓得心率失常。
全新架构
RTX40显卡采用革命性的全新架构,命名为Ada Lovelace(阿达·洛芙莱斯),Ada是英国著名诗人拜伦之女,数学家,计算机程序创始人,被誉为:第一位给计算机写程序的人 。(阅读阿达的简介,也够吓人的,普通人学100年也无法达到她的成就)
Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,Ada拥有众多创新技术,主要有:
1、采用全新SM多单元流处理。
Ada的SM多单元流处理器包含一个重要新技术,叫做:SER(Shader Execution Reordering着色器执行重排序),该技术可以实时重新调度任务,动态调整工作负载,让原本低效的流程变得异常高效,可将色器性能最高提升 2 倍,RTX30系列最快的GPU(RTX3090Ti)为40 TFLOPS,RTX4090Ti超过90TFLOPS。体现在游戏中,可将帧率提升 25%!这项技术和CPU乱序执行一样,属于一项重大创新。
2、第 3 代RT Core (光追核心)
Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能惊人地提高了 2.8 倍。
第3代RT Cores包含了两个全新硬件单元:
Opacity Micromap引擎将光线追踪的Alpha-Test 几何性能提升2倍。
Micro-Mesh引擎可以提升几何图形的丰富度且不会带来更多的BVH构建和存储资源消耗。
3、第 4 代 Tensor Core(张量计算核心)
采用全新的 8 位浮点 (FP8) Tensor Engine 使得吞吐量相较之前提高到令人难以置信的 5 倍之多。
4、DLSS3
这是一款由 AI 驱动的性能倍增器,由第4代Tensor Core和RTX40系列GPU的全新光流加速器驱动,这个全新的AI功能可以在不涉及图形管线的前提下生成全新的帧,而不仅仅是像素。相较于单纯的渲染,游戏性能最高可提升4倍。
光流加速器可将后续帧的像素运动数据输入至 DLSS 神经网络,从而在 GPU 中生成新的帧,即使是在 CPU 资源紧张的情况下也能确保加快性能。图灵和安培架构都有光流加速器,但当时性能弱,英伟达没怎么提。Ada架构大幅度提升了其性能,终于可以拿出来“显摆”了。
在微软模拟飞行 (Microsoft Flight Simulator)”中,整个地球以真实比例 (1:1) 进行渲染,使用 DLSS 3 可使图形性能提升一倍,从而大幅改善玩家的游戏体验。
5、AV1双编码
AV1编码效率提升40%,是主播和视频编辑者的福音。
总的来说,Ada的性能表现,英伟达用了“不可思议”这个词语,对传统光栅化游戏性能提升到安培的2倍,对光追游戏性能提升到最高达4倍。在衡量显卡是否领先的关键指标——能耗比,由于制程和架构的双重升级,Ada是安培的两倍。(即在相同功耗下,性能翻倍)。
从下图可以看出,图灵到安培的能耗比提升比较正常,Ada的提升是吓人的,仿佛从RTX30一下子来到了RTX60系列,已经不像是提升一代的产品。
这次发布了三款产品,英伟达宣称:
RTX 4090,速度是RTX 3090 Ti 的2倍。(注:对比TSE,前者网透为20190分,后者=11096,提升82%,这是光栅化性能,把光追算部分权重后,综合达到2倍)
RTX 4080 (16GB), 其运行速度可达 RTX3080 Ti 的 2 倍。(注:前者预估TSE=15000,后者TSE=9670分,换算后,光栅化性能为RTX3090Ti的1.35倍)
RTX 4080 (12GB) ,超过RTX 3090 Ti (注:前者预估TSE=13300,光栅化性能为RTX3090Ti的1.2倍)
按GTX10、GTX16、RTX20、RTX30和这次的RTX40的迭代关系,站长推测——
RTX4070会取代RTX3090。
RTX4060会取代RTX3080。
RTX4050会打败RTX3060,甚至可以和RTX3060Ti一战。
与其说Ada的进步太吓人了,不如说英伟达太吓人了,有点像两个赛车手在飙车,英伟达长期领先,AMD好不容易来个弯道超车,还领先了两圈,没想到英伟达换装了飞机发动机,速度直接翻倍,观众都没看清楚就飚得没了影子。
Ada这么猛,AMD的RDNA3能追上么?
官方450W的TDP, 顶级非公估计得550W, 整套主机保底得850W电源, 我当初500W电源5600X+6650XT, 以后升级还觉得妥妥的, 现在看一个显卡都喂不饱, 比空调功耗都高,笑哭
英伟达今年这么一闹,AMD核显显然更加成为不少用户的首选了。
这个价格不是问题,问题你功耗能下来么,动不动就300瓦。
现在小机箱越来越流行,我们想使用的电子产品是功耗越来越低,性能越来越强,体积越来越小,现在基本没那一条做到。
感觉英伟达这PPT完全是在忽悠人,看那能耗比提升那一页,纵轴都没有,所以根本不知道到底提升了多少... 画的那么高,乍一看真吓人
性能对比也是什么光追+dlss3的提升,也没说原生的光栅性能,30系发布的时候也是这个套路...
功耗这么高,咱就实在无力吐槽了(骂了太多次了)
最后,老黄的风评已经彻底烂了,现在国内外都是人人喊打...
我看了目前网上的评论,都说4080 16G/12G的命名不对,对比4090的流处理器 阉割太多,而且12G和16G 的核心都不一样了,应该叫4070 4060TI。
真的贵阿,以前1080ti才五千多,这两年卡皇直接飙到一万多去了
还挺想买的 .. 但是这东西大块头一个 老的机箱装不下 .. 可能还要换电源 .... 想想就感觉好麻烦 ....
性能强归强,但价格也越来越脱离普通群众了,30系开始就让人感觉已经没有所谓甜点卡了,40系只怕是渐行渐远。前两天看b站老弟一号的视频讲,虽然这几年各家开启核战时代,一个个堆功耗换取极致性能,但是能耗比其实也都有提升,同功耗下性能对比过去的同定位产品是要强的,这话说得不错,但是很可惜的是,厂商的定价并不照着过去的价位来,这方面cpu其实还好点,显卡就真的是离谱,把矿潮影响撇开,只看官方建议零售价,也是越来越贵,真怕再过两代,显卡就完全是生产力刚需人群的生产力工具,以及游戏玩家的奢侈品了