欢迎您来到极速空间!免费注册

RTX3090Ti黯然褪色,RTX4090/RTX4080出来“吓人”了

在显卡世界里,英伟达和AMD一直在打仗,争夺“地球上能耗比王座”这一至高荣誉。最近的一场战争是在2020年10月29日,AMD用RDNA2(对应RX6000系列)砍翻了英伟达的安培架构(对应RTX30系列)。

英伟达卧薪尝胆,君子报仇,两年不晚。

2022年9月20日,英伟达在秋季GTC大会上,正式发布RTX40显卡,宣称能耗比翻倍提升,这是什么概念?

对CPU来说,其灵魂是IPC,每一代提升20%都属于“吓人”的进步。(一般情况提升5~6%)

对显卡来说,其灵魂是能耗比,提升30%要把人吓一大跳,提升50%会吓得人血压飙升,提升100%会吓得心率失常。

 RTX40系列显卡

全新架构

RTX40显卡采用革命性的全新架构,命名为Ada Lovelace(阿达·洛芙莱斯),Ada是英国著名诗人拜伦之女,数学家,计算机程序创始人,被誉为:第一位给计算机写程序的人 。(阅读阿达的简介,也够吓人的,普通人学100年也无法达到她的成就)

Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,Ada拥有众多创新技术,主要有:

1、采用全新SM多单元流处理。

Ada的SM多单元流处理器包含一个重要新技术,叫做:SER(Shader Execution Reordering着色器执行重排序),该技术可以实时重新调度任务,动态调整工作负载,让原本低效的流程变得异常高效,可将色器性能最高提升 2 倍,RTX30系列最快的GPU(RTX3090Ti)为40 TFLOPS,RTX4090Ti超过90TFLOPS。体现在游戏中,可将帧率提升 25%!这项技术和CPU乱序执行一样,属于一项重大创新。

2、第 3 代RT Core (光追核心)

Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能惊人地提高了 2.8 倍。

第3代RT Cores包含了两个全新硬件单元:

Opacity Micromap引擎将光线追踪的Alpha-Test 几何性能提升2倍。

Micro-Mesh引擎可以提升几何图形的丰富度且不会带来更多的BVH构建和存储资源消耗。

3、第 4 代 Tensor Core(张量计算核心)

采用全新的 8 位浮点 (FP8) Tensor Engine 使得吞吐量相较之前提高到令人难以置信的 5 倍之多。

4、DLSS3

这是一款由 AI 驱动的性能倍增器,由第4代Tensor Core和RTX40系列GPU的全新光流加速器驱动,这个全新的AI功能可以在不涉及图形管线的前提下生成全新的帧,而不仅仅是像素。相较于单纯的渲染,游戏性能最高可提升4倍。

光流加速器可将后续帧的像素运动数据输入至 DLSS 神经网络,从而在 GPU 中生成新的帧,即使是在 CPU 资源紧张的情况下也能确保加快性能。图灵和安培架构都有光流加速器,但当时性能弱,英伟达没怎么提。Ada架构大幅度提升了其性能,终于可以拿出来“显摆”了。

DLSS3提升游戏性能

在微软模拟飞行 (Microsoft Flight Simulator)”中,整个地球以真实比例 (1:1) 进行渲染,使用 DLSS 3 可使图形性能提升一倍,从而大幅改善玩家的游戏体验。

5、AV1双编码

AV1编码效率提升40%,是主播和视频编辑者的福音。

 总的来说,Ada的性能表现,英伟达用了“不可思议”这个词语,对传统光栅化游戏性能提升到安培的2倍,对光追游戏性能提升到最高达4倍。在衡量显卡是否领先的关键指标——能耗比,由于制程和架构的双重升级,Ada是安培的两倍。(即在相同功耗下,性能翻倍)。

从下图可以看出,图灵到安培的能耗比提升比较正常,Ada的提升是吓人的,仿佛从RTX30一下子来到了RTX60系列,已经不像是提升一代的产品。

Ada架构能耗比示意图

这次发布了三款产品,英伟达宣称:

RTX 4090,速度是RTX 3090 Ti 的2倍。(注:对比TSE,前者网透为20190分,后者=11096,提升82%,这是光栅化性能,把光追算部分权重后,综合达到2倍)

RTX 4080 (16GB), 其运行速度可达 RTX3080 Ti 的 2 倍。(注:前者预估TSE=15000,后者TSE=9670分,换算后,光栅化性能为RTX3090Ti的1.35倍)

RTX 4080 (12GB) ,超过RTX 3090 Ti (注:前者预估TSE=13300,光栅化性能为RTX3090Ti的1.2倍)

RTX40系列显卡,期待RTX4050

按GTX10、GTX16、RTX20、RTX30和这次的RTX40的迭代关系,站长推测——

RTX4070会取代RTX3090。

RTX4060会取代RTX3080。

RTX4050会打败RTX3060,甚至可以和RTX3060Ti一战。

与其说Ada的进步太吓人了,不如说英伟达太吓人了,有点像两个赛车手在飙车,英伟达长期领先,AMD好不容易来个弯道超车,还领先了两圈,没想到英伟达换装了飞机发动机,速度直接翻倍,观众都没看清楚就飚得没了影子。

Ada这么猛,AMD的RDNA3能追上么? 

最新咨询/评论

  • **** 2022-09-29 14:53 评价等级:很好

    官方450W的TDP, 顶级非公估计得550W, 整套主机保底得850W电源, 我当初500W电源5600X+6650XT, 以后升级还觉得妥妥的, 现在看一个显卡都喂不饱, 比空调功耗都高,笑哭

    站长回复:

    6650XT在2K下够了

  • **** 2022-09-29 11:51 评价等级:很好

    英伟达今年这么一闹,AMD核显显然更加成为不少用户的首选了。

  • **** 2022-09-27 14:11 评价等级:很好

    这个价格不是问题,问题你功耗能下来么,动不动就300瓦。
    现在小机箱越来越流行,我们想使用的电子产品是功耗越来越低,性能越来越强,体积越来越小,现在基本没那一条做到。

  • **** 2022-09-26 12:21 评价等级:很好

    感觉英伟达这PPT完全是在忽悠人,看那能耗比提升那一页,纵轴都没有,所以根本不知道到底提升了多少... 画的那么高,乍一看真吓人
    性能对比也是什么光追+dlss3的提升,也没说原生的光栅性能,30系发布的时候也是这个套路...
    功耗这么高,咱就实在无力吐槽了(骂了太多次了)
    最后,老黄的风评已经彻底烂了,现在国内外都是人人喊打...

    站长回复:

    你说这个细节站长也注意到了,无纵轴的原因是能耗比没有一个权威计算标准,因此英伟达只给了一个示意图,等具体分数出来后,站长会更新能耗比天梯图,有确切的数值。目前泄露的跑分光栅性能高80%

  • **** 2022-09-26 11:25 评价等级:很好

    我看了目前网上的评论,都说4080 16G/12G的命名不对,对比4090的流处理器 阉割太多,而且12G和16G 的核心都不一样了,应该叫4070 4060TI。

    站长回复:

    是4090本身提升太多,目前符合英伟达的命名体系规律,即高端新卡大约相当于上代的高2~3个档位产品

  • **** 2022-09-23 21:43 评价等级:很好

    真的贵阿,以前1080ti才五千多,这两年卡皇直接飙到一万多去了

    站长回复:

    非4K显示器,没必要买,用RTX4050够了

  • **** 2022-09-23 16:18 评价等级:很好

    还挺想买的 .. 但是这东西大块头一个 老的机箱装不下 .. 可能还要换电源 .... 想想就感觉好麻烦 ....

  • **** 2022-09-23 16:15 评价等级:很好

    性能强归强,但价格也越来越脱离普通群众了,30系开始就让人感觉已经没有所谓甜点卡了,40系只怕是渐行渐远。前两天看b站老弟一号的视频讲,虽然这几年各家开启核战时代,一个个堆功耗换取极致性能,但是能耗比其实也都有提升,同功耗下性能对比过去的同定位产品是要强的,这话说得不错,但是很可惜的是,厂商的定价并不照着过去的价位来,这方面cpu其实还好点,显卡就真的是离谱,把矿潮影响撇开,只看官方建议零售价,也是越来越贵,真怕再过两代,显卡就完全是生产力刚需人群的生产力工具,以及游戏玩家的奢侈品了

    站长回复:

    对4090这类,站长也就凑个热闹,后期看看4050如何

总计 13 个记录,共 2 页。 第一页 最末页

请在这里填写文章评论/纠错

用户名: 匿名用户

台式组装电脑 公司简介 | 联系我们 | 版权声明 | 极速空间淘宝店
技术支持: 武侯区极速空间电脑经营部
实体店地址: 成都市武侯区一环路南二段15号东华电脑城北楼306(服务商:成都德美世纪科技有限公司)

ICP备案证书号:蜀ICP备2023032781号-2

川公网安备 51010702000032号


极速空间网是成都电脑专业DIY网站,提供电脑配置、组装电脑、电脑装机等服务。。
共执行 145 个查询,用时 0.092253 秒,在线 2362 人,Gzip 已启用,占用内存 3.363 MB