如何评价英伟达9月2日凌晨发布的30系列新显卡?
本文整理自知乎問答,僅用于學術分享。如有侵權,請聯系后臺作刪文處理。
編輯|極市平臺
導讀
?就在昨天,NVIDIA創始人黃仁勛正式發布了新一代RTX 30系列顯卡。這三款顯卡的性能均超過上一代旗艦產品,預計將于9月中旬陸續發售,可謂“千呼萬喚始出來”!其中,RTX 3070、3080的售價分別僅為499美元和699美元,性價比十足。而售價高達1499美元的RTX 3090,則擁有10496個CUDA核心,配備24GB GDDR6X顯存,號稱“世界上第一款8K游戲顯卡”。
那么,專業人士如何評價新一代顯卡?本文精選知乎相關話題的優質回答,相信能讓你更好地了解30系列。
評價一
作者丨sumomo tsuru
看完發表會,真香是真香,但難受的是,最近買了兩張TITAN RTX,49年入了國軍。還買了張5700XT,摔。
補充一張圖:
TITAN RTX才4608個CUDA。
國區價格也非常香
這張圖真是清楚明了。3080達到了4.5倍980的性能,但價格只有699美元起,如果以2080對比,快2倍性能提升,真是映證了摩爾定律。3070也非常的香,2070S的價格2080Ti的性能,三分之一的預算就能獲得20系最頂級的游戲體驗。
散熱系統也極其友好,對于多卡系統來說簡直是福音,通過渦輪風扇減少一部分積熱的同時,又最大化的利用了機箱風道,特別適合一體式水冷系統。比20系那套簡單的下壓式不知道高明了多少。
唯一的遺憾就是3080只有10GB顯存,老黃的刀法依舊犀利。
3090其實沒有比3080強太多,但24GB的顯存讓真正的高端玩家只能花兩倍的價格體驗8K游戲,赤果果的價格歧視。
至于煉丹,先等等新一代TITAN吧,看Ampere架構這么厲害,新TITAN估計能到32/48GB顯存,性能超過V100吧。
經評論區補充,以及查看Ampere的架構,30系的CUDA算法應該是把FP64算成2個FP32,所以比20系多了一倍。實際上3090有82個SM,每個SM有64個FP32,也就是說FP32的CUDA數是5248。而3080的FP32 CUDA是4352,3070是2944。2080TI的FP32 CUDA數是4352。但新加入的FP64核心也確實讓30系的單位SM性能提高了將近70%(3070約等于2080TI),很厲害。另外,評論區也有猜測是直接把FP32數量翻倍,這也是很有可能的。
Ampere架構中的SM結構再補充:老黃真的把30系架構里面每個SM里面的CUDA數翻倍了。這應該是上一代在SM加入Tensor Core之后對SM又一次大的調整。另外30系這樣的規模和價格,也有可能是對抗可能出現的XE_hpg。畢竟4tile的XE_hp浮點都有A100兩倍多了。
來源:
https://www.zhihu.com/question/418916610/answer/1448377959
評價二
作者丨小萌貓
這次老黃堆料堆得太狠了,瘋狂塞cuda+擴充顯存,當然付出的代價就是功耗爆炸。
對于游戲玩家而言,秒2080Ti的3070恐怕是最香的,正如這哥們說的那樣:
“和2060的友誼已經終結,現在我最好的哥們是3070”但是對于很多機器學習研究者來說,1499刀,11999人民幣的3090才是真的香,因為搞過圖像訓練的都知道這對顯存的要求非常苛刻,24G DDR6X的顯存,一萬多的CUDA核心,這比賣兩千多刀的TITAN RTX要香太多。。老黃結結實實地在用硬件推進機器學習啊!
此外,別指望資本家突然大發善心,給你們推出一堆香餑餑,逼著老黃踩牙膏的一定是競爭對手。所以等吧,AMD這次一定也非常驚艷,3090的水平當然不用去想,不過中檔卡可以去期待一下的,能不能香過老黃我不知道,靜待佳音~
來源:
https://www.zhihu.com/question/418916610/answer/1448394725
評價三
作者丨Ryan Woo
看完發布會,感覺這代顯卡應該會成為類似于Pascal 那樣的經典:
前面不少朋友提到了這代直接的運算性能提升,作為基本只用顯卡玩游戲的人,從買菜的角度簡單分析下,買菜的都知道,你肯定希望用合適的錢買性價比最高的菜,但是如果同一棵菜只是包裝好一點,你往往不用花多出來的錢去買個包裝。所以用到選顯示上,你只需要關注核心數目就幾乎等同于線性提升的游戲性能。但是花哨的RGB,風扇,官方超頻就是那些沒太大意義的“包裝”。在使用同一塊核心的顯卡中,買最便宜的那塊。這種選擇往往是性價比最高的。
我們先拿上一代Turing 的幾個顯卡作為比較:
圖片來源Anandtech
RTX 2080 Ti 使用的核心是 TU102,擁有 186億個晶體管,Cuda 運算單元:4352,價格 $1200
RTX 2080 使用的核心是 TU104,擁有 136億個晶體管,Cuda 運算單元:2944,價格 $800
所以 2080 Ti 比 2080 貴了50%,晶體管多了37%,但是也提供了48%多的運算單元
而站在買菜的角度,這兩個完全不是同樣的菜,他們用了完全不同的核心,所以無論是性能提升還是價格提升都有跡可循,同時也因為使用了不同核心,一塊流片作廢的 TU102 核心幾乎沒有任何用途(RTX Titan 也是TU102核心,但是核心更多),這完全是高風險,高成本。而流片作廢的TU104可以廢物利用屏蔽幾個核心拿去做成 2070 Super,2070 Super 移動版,或者降低頻率做成 2080 移動版,這妥妥的資金回流,超低風險。
所以某種程度來說,玩家買 2080 Ti 是個“并不壞”的選擇,你確實一分錢一分貨的買到了好產品。根據前面的前提,你其實是花 2080 Ti 的錢享受了 RTX Titan 級別的大部分游戲性能。
同樣的類比可以用在后來發布的 Super 上面,同樣使用了 TU104 核心的 2070 Super 就比使用 TU104 的 2080 和 使用 TU106 更低一檔次的 RTX 2070 性價比顯得更高。而那些買了 RTX 2080 Ti的人,根本都不會多看 2080 Super 一眼,核心 Size 決定了差距不可能靠超頻彌補。
再看一下 Ampere
圖片來源Anandtech
RTX 3090 使用的核心是 GA102,擁有 280億個晶體管,Cuda 運算單元:10496,價格 $1500
RTX 3080 使用的核心是 GA102,擁有 280億個晶體管,Cuda 運算單元:8704,價格 $700
3090 價格比 3080 貴了114%,但是核心是一樣的,所以晶體管數目一樣,僅僅只多了 20% 的運算單元,甚至連電源需求都是一樣的。
如果我們暫不談顯存容量,單從芯片構成來說,3090 與 3080 的對比非常像?2080 super 之于 2070 Super——使用的同一塊芯片,閹割下20%運算單元。但是2080 Super 只比 2070 Super 貴$200 ,而3090 可是貴出了一倍有余...
所以你多付出一倍多的成本,幾乎全部化為買顯存芯片,這24GB的顯存也就只有夸張的8k游戲是剛需。而$1500 與 $700 巨大的價差讓我幾乎可以肯定未來會有 3080 Ti,核心比3080多解鎖 10%,顯存控制在合理的 12GB,價格定到$999,之所以現在不賣,是因為可以作為對抗AMD big navi 性能和宣傳戰的武器,就像當初等著RX 5700 發布才發布的20x0 Super 系列一樣。
圖來源 Anandtech所以從買菜的角度看,可以想像成用了同一個種子,區別就是有機還是無機栽培罷了——3090 和 3080 你買的是同一塊芯片,實際性能差別從理論值推算應該只有10-20%,但是價格貴了一倍多,所以這卡性價比并沒有 RTX 3080 璀璨奪目。如果你真要懟我說 RTX 3090 比 RTX 3080 8k下面快100% 我也無話可說,畢竟爆顯存后的性能劣化根本就沒有多少討論的意義,就像當初 1080 Ti 號稱 4k 下面跑45 fps 比 980 Ti 爆了顯存后只能跑15 fps 一樣毫無意義。更何況,買得起 8k 顯示設備的人,根本不在乎多買兩塊 RTX 3090 SLI...
但是如果你換個角度,RTX 3090 這卡其實并不完全是為游戲玩家設計的,它的真的市場是游戲之上,學術科研之下的 Titan,眾所周知,Titan 系列就是得益于巨大的顯存成為深度學習的翹楚,而對于前一代Titan $2500的高昂售價, Volta V100 $10k起的價格,3090 24GB 顯存 $1500 突然變得和藹可親了。
再多提一句 RTX 3070,雖然它的風光完全被 3080 蓋住了,這塊卡將會是非常不錯的中端銷量王:
RTX 3080 使用的核心是 GA102,擁有 280億個晶體管,Cuda 運算單元:8704,價格 $700
RTX 3070 使用的核心是 GA104,擁有 170億個晶體管,Cuda 運算單元:5888,價格 $500
所以 3080 比 3070 貴了40%,晶體管多了64%,也多了 48% 的運算單元,性能堪比上一代 2080 Ti,繼續上演當年 Pascal 1070 戰翻 980Ti 的輝煌。也成為不錯的老卡升級選擇,從9系,10系,和 AMD 過來的玩家,直接升級 3070 就能獲得4k dlss 光追,而且性能不俗。
但是,從上面的分析來說,你雖然省了40%的錢,你買的也是更低一檔次的核心,所以任何額外增加價格的添頭,都不如直接多花些錢買 RTX 3080 一步到位劃算。
最后關于性能提升,很多人都會祭出這張圖:
與以往胡搞 Y 軸官圖不同的是,這次的數據其實挺靠譜的,Y 軸是恒定比例的性能,而圖中 2080 super 和 2070 super 相對 1080Ti 和 1080 提升是有無數測試作根據的,差不多就是20-30%的幅度,這在表上被如實反映了。所以如果按照表格數據推算,3080 直接比 1080Ti 強了1倍,比2080 Super 強了大約70%,3070 確實可以戰平 2080Ti,但是我要多說一句的是:
并不完全是Ampere 太強,而是因為Turing 這代太弱。
歷史上,每當顯卡推出革命性新功能的那一代,絕對的性能提升往往很小,甚至不如上一代,因為你要消耗更多的芯片面積和晶體管去滿足新功能的實現,但是下一代往往就是無腦堆性能了,因為有了前代的經驗,這代卡就能取長補短,而且不用考慮支持新特性:
GeForce 8600 GT 這代顯卡升級了對 DX10的支持,性能相對 7900 提升非常小,DX9中甚至不及,但是繼任者 8800 GT 又刷新了記錄,達到兩倍的性能提升。
RTX 2080 相對 GTX 1080 提升幅度也有限,也是被光追這個大頭功能拖累。
所以等到第二代改版核心 RTX 3080 一舉超過孱弱的第一代光追卡,并不稀罕。而且這還有DLSS 2.0 的神助。從目前已有的 DLSS 2.0 游戲來說,這個功能能顯著增加 1080p 以上畫面的渲染性能,用極小的畫質差異,換取幾乎高一級的性能提升。再輔以光追,3080 這代卡真的可以說在 DLSS 4k + 光追下 暢玩60 fps 游戲,這足以跟新一代主機和上上一代顯卡拉開差距。所以顯卡來說,隔代升級往往是非常不錯的方式,性能和畫質提升能察覺到質變。
最后回應回答最初的那個結論,為什么 Ampere 會成為 Pascal 那樣的經典:
其實是因為造芯片便宜啊!留給NVIDIA 巨大的降價空間
980 Ti 貴就貴在使用 TSMC 28nm 制程,強堆了600mm2 的芯片面積來對抗 AMD R9 Fury X。
而使用了 TSMC 16nm制程的 1080 Ti, 輕松通過通過471mm2 的芯片面積就干掉使用成本巨高 HMB 顯存的 Radeon VII。而 1080 更是通過 314mm2 甜品芯片面積跨級做掉 Vega 64 大殺四方,剛好又趕上 Navi 難產的青黃不接,成為一代經典。
而到了 RTX 2080 Ti,無奈繼續使用半代工藝的 TSMC 12 nm,把芯片搞到了史無前例的754mm2!這就算是賣 $1200 成本也是當年 1080 Ti 的兩倍以上。幸好對手 AMD 放慢了顯卡研發的腳步,導致即便如此終其一生也沒有競爭對手。
現在終于迎來了使用 三星 8nm 制程的 RTX 3090,雖然芯片面積沒有透露,但是肯定遠小于前一代的 754mm2,估計在550mm2左右,用這樣的甜點芯片面積就能造出賣$1500的顯卡,這不是賺翻是什么?所以即便如此,RTX 30系列也留下了充足的空間進行價格戰。而當價格下降后,消費者空前的熱情是擋不住的。
最后再提個小插曲,RTX 3080可以說極大借鑒了 Nvidia在數據中心服務器設計的經驗,例如之所以用到那么創新的雙風扇正反設計,一部分也得益于主板的設計精簡:
而這種極其精簡的設計又傳承自之前的 Volta V100:
所以這不僅意味著我們會看到很多AIO廠商在散熱器上繼續玩出花,也意味這這代GPU能快速進入ITX機箱,移動平臺。
所以如果還有什么忠告的話,千萬不要買目前的游戲筆記本!
如果你能等上3個月,不出意外1月就能看到官宣的 30系 筆記本GPU,而性能相對于20系也是大大的提升。
來源:
https://www.zhihu.com/question/418916610/answer/1448428805
評價四
作者丨ssertp
其實你們太小看8nm了。
很多人都不知道,三星在10nm節點吊錘臺積電,10nmLPE能比第一代14nm提升27%的性能或者降低40%的功耗,10nmLPP在此基礎上把性能再次提升10%,功耗降低15%。8nm在此基礎上又降低了10%的功耗。
粗略計算一下,在同架構下,相較于GTX1050采用的14nm,8nm制程可以提升超過40%的性能提升或者降低至少54%的功耗,晶體管密度也實現了翻倍。
只要老黃愿意,同樣的面積,三星8nm能輕松做到性能翻倍,畢竟比之前的工藝省電一半啊!所以才有了499刀的3070打2080Ti,699刀的3080一個頂倆。
另外,三星的8nm比臺積電的10nm還便宜,而且是便宜得多。這個制程更適合高性能領域,之前嘲諷老黃貪婪的,現在豈不大呼真香?
來源:
https://www.zhihu.com/question/418916610/answer/1448373748
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載機器學習的數學基礎專輯獲取一折本站知識星球優惠券,復制鏈接直接打開:https://t.zsxq.com/662nyZF本站qq群1003271085。加入微信群請掃碼進群(如果是博士或者準備讀博士請說明):總結
以上是生活随笔為你收集整理的如何评价英伟达9月2日凌晨发布的30系列新显卡?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【NLP】Word2Vec详解(含数学推
- 下一篇: 【资源】首发:徐亦达老师的机器学习课件及