本文約7627字,需13分鐘閱讀

qq飞车s车排行榜2018 www.bjswc.icu 之前的課堂文章中我們介紹了NVIDIA顯卡從Kepler架構到Turing架構的演變史,今天這個就是姊妹篇AMD顯卡架構演變史了,更準確地說是GCN架構這七年來的變動,因為從2012年推出GCN架構之后AMD就在打磨GCN上停不下來了。

在GCN架構之前,AMD在GPU架構上也探索過了很多方案,這時候AMD已經接管了ATI的GPU研發,2006年收購ATI時AMD有個很重要的夢想就是用GPU彌補CPU計算的不足,有些玩家可能還記得AMD當年大力宣傳的異構計算吧,還拉攏了ARM、三星等公司組成了HSA異構運算基金會推CPU+GPU運算。

2011年前AMD GPU架構:TeraScale之VILW5到VLIW4

AMD將2002之前、2002到2006、2007年到2012的GPU發展分為三個階段,第一階段是固定單元,專注游戲性能,第二階段是簡單渲染,第三階段則是并行GPU運算,AMD接受ATI后已經是第三個階段了。

ATI的絕唱是XT1900系列,HD 2000及之后就是AMD主導了,這個時代直到HD 6000系列,由TeraScale架構主導,其中比較重要的節點有HD 4800系列、HD 5800及HD 6900系列,代號Cypress的HD 5800時代開始上DX11了,代號Barts的HD 6800系列在HD 5800基礎上修改,提高能效,而代號Cayman的HD 6950則將TrgeaScale發展到巔峰,核心架構也從之前的VLIW5升級到了VLIW4。

對于這個架構的變化,多年前超能網的評測中也做過詳細解釋了:

在Cayman核心中,VLIW處理器中的ALU數量被精簡到了4個,拋棄了VLIW5處理器中的ALU.trans,我們稱Cayman的這種VLIW為VLIW4處理器。應該說Cayman核心是自R600以來,在硬件架構上變動最大的一個。VLIW4回歸到了傳統ALU的4D模式,只是變成了更靈活的4個1D。對于一個部門來說,顯然管理4個人比管理5個人更簡單高效,或許AMD也是這么想的。

和VLIW5不同的是,VLIW4中的四個ALU功能都是對等的,可以實現4-way Co-issue操作,原來由ALU.trans完成的特殊函數操作現在也可以交給這四個ALU來完成了,不過一個特殊函數操作需要占據四個指令發射中的3個。

AMD聲稱,VLIW處理器結構的改變(VLIW5->VLIW4),同樣核心面積的條件下能帶來10%的性能提升,簡化了指令調度和寄存器管理,提升邏輯電路利用率。不過從VLIW5改變到VLIW4,隨之而來的是晶體管和功耗的大幅增加,這是不得不付出的代價。

在整個TeraScale時代,可以看出來AMD一直在改進VLIW架構的效率,AMD此前表態VLIW架構非常適合圖形運算,但GPU計算不太好,這個判斷也會影響后來的架構設計,因為AMD念念不忘的就是GPU計算。

另外,在HD 4800到HD 6900的時候,個人都很喜歡公版AMD顯卡的外觀設計,那時候AMD顯卡的PCB設計及用料也很扎實,雖然渦輪單風扇噪音問題一直有點無解,但總體來看顏值還是很高的。

2012年GCN 1.0問世:圖形、計算雙冠王

在VLIW架構下折騰了多年,AMD終于在2012年初(2011年底就發布了)推出了HD 7970顯卡,核心代號Tahiti塔西提,架構則是Graphic Core Next,GCN架構閃亮登場,距離現在已經7年了,但GCN架構依然是AMD顯卡的基礎,堪稱史上最長壽的GPU架構。

當年HD 7970的首發評測中,我們稱其為圖形、顯卡雙冠王,這個標題就是AMD要在GCN架構上實現的目標——不僅要游戲性能強大,還要靈活應對GPU計算時代,要提高GPU的多線程處理能力,優化高性能計算,提高擴展能力和彈性,所以GCN架構的計算性能提升是最明顯的,我們當年的首發評測也證實了這方面的進步。

GCN架構中基本的組成單元為“Compute Unit”(簡稱CU),完整的GCN核心有32個CU單元,每個CU單元又下轄64個ALU單元和4個TF紋理單元,總計有2048個ALU計算單元,128個紋理單元,相比之下HD 6970的流處理器單元只有1536個,紋理單元也只有96個。

前端部分延續了HD 6970顯卡所用的“Dual Graphic Engines”雙圖形引擎結構,有兩個ACE(Asynchronous Compute Engines異步計算引擎)和兩個Geometry Engines(幾何引擎,第9代曲面細分單元)引擎。

HD 7970還有8個后端渲染單元,每周期可以實現32個ROP光柵渲染和128個Z/stencil渲染,這一點與HD 6970倒是沒有分別,不過顯存位寬加大了,后端處理性能還是有提升的。

32個CU單元之外是6組GDDR5顯存控制器,每組64bit,顯存位寬為384bit,這也是AMD首次使用384bit顯存位寬,再結合1375MHz的高速度,HD 7970的顯存帶寬達到了264GB/s,顯存容量也再上一個臺階,達到了3GB。

與VLIW 4體系的一組SIMD陣列相比,二者的ALU單元總數是相同的,每個CU以及SIMD陣列單元都能執行64個單精度混合乘加運算,好比16*4和4*16都等于64一樣,但是區別在于,VLIW 4每次雖然可以執行4個ALU運算,但是每個ALU單元不能獨立運算,需要組合成VLIW 4才可以,效率和調度是個問題,而GCN的4 SIMD陣列每周期可以執行1個ALU運算,但是四組SIMD可以互不依賴,只要有進程就一直是100%效率。

內核架構的改進說起來只是GCN架構大變身的一部分,HD 7970顯卡身上還有其他閃光點,比如首發支持28nm工藝、PCIe 3.0、改進曲面細分、Eyefinity寬域2.0多屏擴展、HD3D立體顯示、UVD視頻引擎、ZeroCore功耗管理等等,幾乎涉及顯卡性能、功耗、發熱、顯示、視頻編碼等方方面面,可以說GCN架構加持的HD 7970顯卡從內到位都是煥然一新的。

2013年GCN 2.0架構:CU單元擴增,512bit位寬重出江湖

HD 7970顯卡一問世就好評不斷,不論是對家自家上代旗艦還是NVIDIA當時的旗艦產品都有明顯的優勢,計算及游戲性能大幅領先,NVIDIA直到3個月后推出GTX 680才算勉強扳平。AMD在第一代GCN架構之后也在不斷改進,于2013年10月底的R9 290X顯卡上正式推出了新一代GCN架構Hawaii核心。

對于GCN架構的斷代,AMD最初的說法是GCN 1.0、GCN 1.1、GCN 1.3等等,這個命名可以看出GCN架構是小幅升級的,但在2016年的Polaris架構中AMD時任GPU老大Raja Koduri大筆一揮,將命名方式改為GCN 1.0、GCN 2.0、GCN 3.0直至Vega的GCN 5.0,這篇文章薩我們就基于最新的官方命名體系,所以原本是GCN 1.1的Hawaii核心就是GCN 2.0架構了。

考慮到HD 7970的GCN 1.0架構打下了足夠好的基礎,GCN 2.0作為改良版沒有大修大建的必要,所以Hawaii核心的官方定性就是GCN架構持續進化,首先是大幅擴增了CU單元數量,從HD 7970的32組CU單元提升到了44組CU單元,它由4組Shader Engine渲染引擎組成,每組渲染引擎又包含11組CU單元,每組CU單元的組成基本不變,這樣一來CU單元總數就從原來的32組提高到了44組,流處理器單元數量從2048提高到了2816個,紋理單元則達到了176個。

此外,幾何單元和光柵單元也被放到了渲染單元中,Hawaii核心的幾何單元數量就從原來的2組變成了4組,而ROP單元從原來的32個暴增到64個。

在Hawaii架構中值得關注的改進還有前端單元,ACE異步計算引擎從之前的2組提高到了8組,而且Hawaii的ACE單元執行能力大幅提升,每周期可管理8個隊列,Tahiti核心中的ACE每周期只能管理2個隊列,總的管理能力從每周期4隊列提升到了每周期64隊列。

另一個值得注意的地方是顯存位寬,Hawaii核心將成為Radeon HD 2900XT之后另一個采用512bit顯存位寬的顯卡了,此前包括NVIDIA的GK110和AMD的Tahiti核心在內的一眾旗艦顯卡都只用了384bit位寬。

AMD設計師解釋稱他們仔細評估了高頻率+低位寬與低頻率+高位寬兩種顯存設計的利弊,認為高位寬+低頻率的組合還是要優于前者,通過優化,521bit顯存控制器占用的面積反倒比之前384bit位寬更低20%,因此Hawaii選擇了512bit位寬,這樣一來顯存頻率不需要太高就能達到極高的帶寬。

回頭看看當時的首發評測,里面提到代一句話——“Hawaii的8個ACE單元設計跟PS4是一樣的,管理能力也是一樣的,據說這是索尼建議AMD改進的。”在當時認為AMD官方這么說沒什么特別的意思,現在結合去年爆出的信息,可以說AMD之前為索尼、微軟設計主機處理器對他們設計桌面GPU的影響很大,現在來看AMD的選擇就有一種豁然開朗的感覺了,怪不得AMD GPU上會有一些對PC游戲來說看似沒什么用或者說不明所以的設計,根子就是在主機處理器上。

在GCN 2.0架構中還有一個新的技術,那就是TrueAudio音頻技術,號稱世界首款可編程音頻渲染技術,在Hawaii核心里還有一部分電路是給TrueAudio準備的,集成了Tensilica公司的多聲道HiFi EP音頻DSP單元,支持自定義編程。

AMD認為目前只有10%的CPU性能是用來處理音頻的,這限制了游戲開發者進一步提高游戲的音效,而且USB音頻驅動帶來的也只是虛假的3D音效,而在TrueAudio專用的音效單元中,開發者可以借助可編程音頻單元實現更好、更逼真的3D音效,提升了玩家的游戲體驗,同時專用的電路也可以降低CPU的負擔,解釋運算資源。

此外,R9 200系列顯卡的GCN 2.0架構還有一些技術值得關注,比如名噪一時的Mantle優化,在DX12/Vulkan沒來之前,AMD的Mantle優化了底層硬件的效率,雖然最后AMD也不再推Mantle了,但Mantle使命已達,影響了DX12及Vulkan API的發展,功不可沒。

還有就是XDMA交火技術,不需要軟橋或者硬橋就能連接多卡,這給玩家省了一筆費用,而友商可是把SLI硬橋當作信仰充值的工具的。

盡管GCN 2.0架構的Hawaii核心技術上亮點不少,性能也很強大,但是R9 290X顯卡作為旗艦卡卻是翻車了,提升性能的同時功耗也大幅增加了,導致R9 290X散熱、噪音表現不佳,94°C的溫度讓不少玩家望而卻步,特別是國內玩家對顯卡低溫很敏感,再加上4599元的價格,這個價格及其表現嚇阻了玩家擁有R9 290X顯卡的決心。

2015年GCN首次馬甲:R9 300系列換湯不換藥

R9 200系列高端顯卡的表現不盡如人意,除了導致AMD損失顯卡份額之外,也讓AMD沒動力大幅升級GCN架構了,因為AMD當時還在搞另一件大事,所以2015年的時候AMD讓以往4000+高端市場的R9 290系列顯卡玩起了馬甲戰術,變成了3000出頭的中高端顯卡,推出了R9 300系列顯卡,其中R9 390X雖然名義上市新的Grenada核心,但2816個流處理器單元、512bit位寬等規格與R9 290X的Hawaii核心沒變,只是GPU核心頻率從1000MHz提升到1050MHz,顯存容量翻倍到8GB。


R9 390系列顯卡規格


R9 380系列顯卡規格

值得一提的是,AMD跟當年的NVIDIA一樣,高端顯卡的GPU核心不一定有架構升級,但是中端核心可能就會首先嘗試新架構,R9 285顯卡的Tonga核心就不同于GCN 2.0,在官方認定中它是跟下面的Fiji核心一樣是GCN 3.0時代的,只不過不像后者那樣用上了HBM顯存。

2015年GCN 3.0架構:Fury攜HBM以令天下,CU單元上限到了

2015年的時候R9 390系列不再是AMD的旗艦卡了,所以它的價格大幅下滑,因為有比它更厲害的顯卡問世了,那就是全新的R9 Fury系列,這些顯卡使用的是Fiji核心,跟Tonga核心一樣都是GCN 3.0架構的,在這一代中AMD再次擴增了GCN架構的CU單元數量,達到了64組,總計4096個流處理器單元,256個紋理單元,64個ROP單元,核心面積達到了596mm2,晶體管數量則達到了89億個,比NVIDIA的GM200核心的80億個還要多。

相對于Hawaii/Grenada核心來說,Fiji前端單元沒有變化,同樣是8組ACE單元,4組幾何單元(曲面細分單元),4組渲染引擎(Shader Engine),但CU計算單元數量增加到了64組,每組渲染引擎單元包含了16組CU單元,之前的Hawaii是每組11個CU單元。

另一個值得注意的變化是顯存控制器,Hawaii/Grenada是8組64bit GDDR5主控,總計512bit位寬,而Fiji核心增加了HBM顯存支持,所以有4組HBM顯存控制器。

實際上HBM顯存才是Fiji核心及Fury系列顯卡的最大亮點,個人認為這也是顯卡多年來變化最大的一次,因為HBM不僅僅是性能更高的顯存,還從根本上改變了顯卡設計。

對于HBM顯存,AMD早在2008年就開始布局研發了,攜手ASE、Amkor和UMC聯合研發了首個可大批量生產的中介層解決方案,也就是HBM顯存。這種方案靈活度也挺大的,一方面可以讓顯存盡可能地接近邏輯核心,以獲得極大的總線位寬和效率、簡化通信和時脈,還允許集成不同的技術,未來的新顯存技術也能集成到中介層上。

當時GDDR5雖然頻率普遍已經達到了1750MHz(實際7000MHz以上),每個封裝位寬為32-bit,帶寬為28GB/s,每瓦帶寬實測10.66GB/s。而第一代HBM頻率最高只有500MHz(實際工作頻率1000MHz),但是每個封裝的總線位寬高達1024-bit,帶寬超過100GB/s,電壓低至1.3V,每瓦帶寬超過35GB/s,實測功耗降低50%以上。

再考慮到空間占用問題,1GB GDDR5需要4顆芯片,而HBM只要一顆7mm×5mm的小芯片,單位容量表面積減少94%,而且因為HBM是和邏輯核心集成在同一塊基板上,可以節省更多的空間。雖然PPT上說的只是邏輯核心+顯存占據的PCB面積,并非整張顯卡PCB的面積,不過可以預見最終顯卡也可以做得很短。

在當時AMD一共推出了三款Fiji核心的顯卡——R9 Fury X、R9 Fury及R9 Nano,其中Fury X一改之前R9 290X的教訓,使用了一體式水冷設計,雖然安裝過程麻煩點,但是散熱效果非常好,即便是Furmark拷機時,最高溫度也只有61°C。至于噪音,這點也無需擔心,低負載下風扇轉速維持在1000RPM內,最高也不過1300RPM多點,全程都非常安靜。

Fury X很好很強大,不過要說我個人最喜歡的顯卡還是非R9 Nano莫屬,HBM顯存帶來的高性能、小面積優勢在這個顯卡上完全體現出來了,真正的ITX小鋼炮,而且與Fury顯卡相比,AMD在R9 Nano顯卡上的功耗調校完全不是一個級別的,頻率降至1GHz之內GCN架構的能效還是有一定優勢的。

在GCN 3.0的Fiji時代,AMD用HBM顯存震驚了業界,但是成也蕭何敗蕭何,HBM顯存量產在技術上是一次突破,但嘗鮮的代價也不低,別說4年多之前了,迄今為止HBM顯存都是高價的代名詞,產能、成本都是個問題,導致了Fury系列顯卡初期供應并不太好,而且價格也降不下來,那時候面對NVIDIA的Maxwell顯卡能效上還是沒優勢的。

2016年GCN 4.0架構:Polaris升級14nm工藝,能效提升

Fiji核心是AMD 28nm工藝節點的絕唱,各項規格也達到了AMD當時的頂峰,但是AMD GCN架構的能效問題越來越嚴重了,特別是后來NVIDIA推出了Maxwell架構,同樣是28nm工藝,能效可是大幅進步的,導致AMD亞歷山大,也不得不重視能效問題了,所以他們準備的新方案就是GCN 4.0架構的Polaris核心,升級到了14nm工藝。

根據AMD所示,Polaris除了關注性能提升之外,重點就是優化能效,每瓦性能是前代的2.8x了。

對于Polaris核心顯卡,AMD的定位也不一樣了,它不再是競爭旗艦級市場,命名也變成了Radeon RX 400系列,其中RX 480具備36組CU單元,遠不如Fiji的64組甚至不如Hawaii核心的44組CU單元,而且這36組CU單元中還有4組CU單元是給TrueAudio單元預留的,實際用于圖形運算的只有32組CU單元,這就回到了初代GCN的水平了。

不過GCN 4.0架構改進了幾何單元、提升了渲染器效率、改進了色彩壓縮、L2緩存容量翻倍等等,因此與前代R9 290X顯卡相比,其CU計算單元性能提升了15%。

除了GCN 4.0核心架構改進之外,Polaris還改進了視頻輸出,RX 480顯卡支持DP 1.3、HDMI 2.0,并預先支持DP 1.4接口。視頻解碼編碼方面,Polaris架構也做了改進,H.264編碼支持4K 30Hz編碼,HEVC/H.265則可以支持到4K 60Hz編碼。

工藝方面,Polaris也是一次重要的變化,此前AMD的GPU都是TSMC代工的,CPU是GF代工的。從14nm工藝開始,AMD的GPU也有GF公司代工了,最初的說法是AMD會同時使用TSMC 16nm及GF 14nm工藝,但實際上他們只使用了GF 14nm工藝,GPU不再由TSMC臺積電代工了。

根據官方資料,14nm工藝使得顯卡運行電壓降低了150mV,功耗降低了30%,所以Polaris架構使用的14nm工藝相比28工藝能提升70%的每瓦性能比,但在AMD優化之后,新顯卡的能效比最終達到了前代水平的2.8倍。

綜合RX 480顯卡的表現來看,在1999元的售價下它的競爭力還是不錯,整機功耗比R9 380X還要低,比NVIDIA的GTX 980/970顯卡能效還有一定距離,但已經不是代差了,畢竟他們的價格也差了一大截。

2017年GCN 5.0架構:RX Vega橫空出世,HBM2再沖高端市場

2017年AMD又推出了第二款14nm工藝的顯卡,也就是RX 500系列,實際上它也就是14nm Polaris顯卡的馬甲,主要是提升了頻率,RX 580由原來RX 480默認頻率的1120MHz提升至1257MHz,boost頻率上限增至1340MHz。RX 570也相應提升至1120-1266MHz水平,預期性能增幅9-10%。

2017年真正的新品是RX Vega系列,這一次AMD直接用新核心做為顯卡命名,并一直沿用到了現在。雖然我們習慣說是GCN 5.0架構,不過這個說法AMD官方沒有提,他們用的說法是NCU計算單元,不過這里出于統一的習慣還是稱其為GCN 5.0。

AMD當時的RTG部門主管Raja Koduri在PPT中對Vega的重大改進做了詳細介紹,看官方資料絕對是各種雞血,當時也確實這樣的,因為前幾年AMD在高端顯卡市場就已經乏力了,GCN架構不論性能還是能效相對Maxwell、Pascal都沒優勢了,大家都希望Vega能夠重振AMD高端市場雄風。

從官方資料來看,Vega使用的GCN 5.0架構變化還真不少,主要涉及Vega顯卡新一代顯存架構、Vega顯卡新一代幾何渲染管線、Vega顯卡新一代NCU單元、Vega顯卡新一代像素引擎等,而且這一次AMD又把新一代HBM顯存技術用于消費級顯卡了(NVIDIA在AMD之前率先在Tesla P100上用了HBM2顯存了,但消費級沒有大規模推)。

Vega核心雖然還是64組CU單元總計4096個流處理器單元,但內部單元做了改進,AMD宣稱是優化了IPC性能,并提高了運算單元的靈活性。

在計算性能上,Vega首度引入了緊縮的半精度計算支持,Vega的微架構被稱為“NCU(下一代計算單元)”,每個NCU中擁有64個ALU,它可以靈活地執行緊縮數學操作指令,如每個周期可以進行512個8位數學計算,或者256個16位計算,或者128個32位計算。這不僅充分利用了硬件資源,也大幅度提升Vega在深度學習計算的性能。效果也非常顯著,在之前公布的Radeon Instinct MI25計算卡就是基于Vega架構的,其FP32單精度浮點性能12.5TFLOPS,而半精度FP16性能直接翻倍到25TFLOPS。

除了 NCU內核的改進,Vega的重點還是圍繞HBM2顯存來的,但是這一代的HBM2顯存為了減少成本,只用了2顆堆棧,等效位寬從上代Fury X的4096bit降至2048bit,通過頻率提升到1890MHz實現了484GB/s的帶寬,但比Fury X的512GB/s實際上降低了。

不過AMD為了彌補這個問題,開發了HBCC高帶寬緩存控制器,除了顯存自身之外,可以連接顯卡PCB接入的SSD(Radeon Pro SSG那種)、網絡存儲、系統DRAM等不同形式的片外存儲器件,甚至可以將HBM 2顯存作為最后一級緩存使用,將片外存儲器件的尋址頁面保存在顯存中,方便GPU調取外部數據時快速尋址,減少延遲。

在《殺出重圍:人類分裂》中,啟用了HBCC高帶寬緩存控制后,GPU的顯存尋址效率提升明顯,對應所需的顯存大小需求更小,從而提升了游戲畫面速度。在幀率優化演示中,啟用了HBCC后,游戲平均幀數提升了50%,最小幀率提升一倍,游戲畫面非常流暢。

Vega顯卡的GCN 5.0/NCU架構紙面上很強大,實際性能也不弱,水冷版RX Vega 64能戰GTX 1080顯卡,不過RX Vega系列三款顯卡整體的表現依然不盡如人意,最高性能拼不過NVIDIA的GTX 1080 Ti等顯卡,能效依然是個短板,而且HBM2顯存依然是產能低、成本高,讓AMD再次吃盡了苦頭。

所以說從最初的Fury X到RX Vega,AMD在HBM技術上可以說是先鋒,但在商業策略上談不上成功,反而深受其害。

2018-2019年GCN架構:RX 590打磨12nm,7nm浴火重生?

雖然RX Vega在游戲市場失利,但是AMD幸運地遇到了2017-2018年初的數字貨幣熱潮,而RX Vega及RX 480/580等顯卡用于挖礦不錯,所以AMD當年并不愁賣,由于挖礦商人們的大肆收購,曾經RX 480、RX 580等熱門顯卡一票難求,而且大幅漲價到3000元以上。

不過2018年下半年開始,礦卡市場又崩了,留給AMD及NVIDIA一堆庫存問題,所以2018年AMD實在出不了新架構顯卡了,年底的時候才推出了12nm工藝的RX 590顯卡,今年1月初還推出了7nm工藝的Radeon VII顯卡,不過大家都知道今年的重點是7nm Navi顯卡。

對RX 590來說,其核心及架構都沒什么變化的,依然是Polaris那一套的,第四代GCN架構,36組CU單元,36×64=2304個SP流處理器,144個紋理單元,32個ROP光柵單元。顯存也同樣保持一樣的規格,位寬256bit,顯存頻率8GHz,帶寬256GB/s,TDP提升到225W。

最明顯的提升就是頻率上的變化,RX 580已經由RX 480的1120MHz提升至1257MHz,RX 590再次提升至1545MHz。RX 580到RX 590頻率提升在15%左右,可見RX 590性能提升也應當在15%上下。

至于Radeon VII顯卡,它使用的依然是Vega核心,不過制程工藝升級到了臺積電7nm,14nm Vega顯卡核心面積為495mm2,7nm Vega核顯面積下降到331mm2,面積縮小了33%,同時晶體管數目也略微增長了5.6%。

此外,Radeon VII最高頻率達到了1800MHz,都快追上NVIDIA顯卡水平,上一代RX Vega 64風冷版也只有可憐的1546MHz,頻率提升幅度在16.5%,這部分頻率紅利會直接反應到性能表現上。

至于核心架構,第二代Vega架構也沒有大動作的變動,主要是做了額外的優化,針對計算增加了一些新的指令集,提高深度學習性能,還有就是提高NCU單元的工作頻率、減少傳輸延遲、增加光柵單元的交互帶寬,以此換取更好的游戲性能。

在HBM2顯存上,Radeon VII也補全了之前的遺憾,不僅容量翻倍到16GB,而且還是全速4096bit位寬,帶寬高達1024GB/s,這樣的性能已經超出了游戲卡范疇,所以AMD也一直在強調友商11GB顯存的顯卡不夠用了,16GB才能更好地應付游戲、內容創作等需求。

憑借7nm工藝帶來的頻率紅利及16GB HBM2顯存的優勢,Radeon VII顯卡的性能達到了GTX 2080級別,給AMD 7nm GPU家族開了個好頭,不過這樣做的代價也不小,功耗、能效依然是AMD的痛,7nm Vega并沒有質的改變。

大家期待的關鍵還是7nm Navi了,這個才是針對主流游戲市場的,本月底的臺北電腦展我們就能看到它了。

總結

2012年初GCN架問世時可以說光芒萬丈,各項技術指標都要領先AMD及NVIDIA當時的旗艦卡,實現了AMD追求的圖形、計算雙雙突破的目標。如今7年過去了,GCN架構依然是AMD GPU的主力架構,盡管官方表示迭代升級了GCN 2.0、GCN 3.0、GCN 4.0、Vgea NCU等等,但AMD顯卡這7年來的核心變化并不多,SIMD陣列64個ALU單元的基本組成沒變。

在NVIDIA推出Maxwell、Pascal顯卡之后,AMD的GCN架構在能效上的劣勢愈發明顯,以后來者的眼光來看,GCN這幾年來遇到的瓶頸有兩部分,一個是CU單元規模,目前依然沒有超過2015年的Fiji核心的4096個,Vega也是如此,而另一個瓶頸就是頻率,AMD是最早突破1GHz GPU頻率的,但是NVIDIA在Pascal架構上可以輕松實現2GHz頻率了,可AMD GCN顯卡在頻率超過1.5GHz之后功耗大增,能效更差了,雙方因為架構、代工工藝的選擇早已經分道揚鑣了。

對AMD及AMD粉絲來說,7nm Navi已經成為今年最大的期待及籌碼了,在Fiji、14nm Vega、7nm Vega讓人失望之后,Navi的售價及性能將成為AMD顯卡今年翻身與否的關鍵了,可以確定的是它還會使用GCN架構,就看AMD如何改進了。

?
  • 游客  06-04 21:35

    游客:

    好文。HD5000系列=劃時代之作。HD6000系列=繼續發掘潛在性能。HD7000系列=吃老本。HD8000系列那會是AMD人事變動最亂的時候,而且可能剛準備改,礦潮來了。。。AMD驚奇的發現,原來GCN挖礦比NV更好,顯卡更好賣,干脆不改了。。。一拖就拖到阿三跳槽INTEL,大衛·王上位。
    06-04 21:30
  • 支持(0)  |   反對(0)  |   舉報  |   回復
  • 我就是HD5770用戶,當時電腦城才1200出頭,相當于現在2060級別,通吃所有游戲,而且還能眼看戰未來2年3A大作沒問題。后來也證明,除了當時沒估算到未來游戲顯存會吃越來越多外,其他基本沒得挑。(后來幾年,顯存增長頻率幾乎是1年漲1G的節奏,從1G顯存還帶動態使用,漲到主流都是6-8G水平)。最近丐版影馳1060壞了,拿出來過渡2天,DOTA2和WOW照樣不虛,還能玩。不過吃雞和全境封鎖2就不行了。

    支持(0)  |   反對(0)  |   舉報  |   回復

    31#

  • 游客  06-04 21:30

    好文。HD5000系列=劃時代之作。HD6000系列=繼續發掘潛在性能。HD7000系列=吃老本。HD8000系列那會是AMD人事變動最亂的時候,而且可能剛準備改,礦潮來了。。。AMD驚奇的發現,原來GCN挖礦比NV更好,顯卡更好賣,干脆不改了。。。一拖就拖到阿三跳槽INTEL,大衛·王上位。

    支持(0)  |   反對(0)  |   舉報  |   回復

    30#

  • yjhercules終極殺人王 05-19 09:40

    //nb.zol.com.cn/716/7167490.html
    阿三哥噴 老東家amd
    確實,我也噴現在和原來的老東家
    畢竟 想賺錢 肯定是有戰術
    沒有戰術 肯定是不行
    nv的戰術就是很多。充分應用了中國的36計
    amd 36計沒有用上 只會田忌賽馬

    amd 570芯片 應該是ati 芯片小組的產品
    也就是銳龍之前 到amd 不讓nv via sis 生產主板芯片之間
    這些amd 主板無味芯片的設計團隊

    已有5次舉報

    支持(0)  |   反對(2)  |   舉報  |   回復

    29#

  • 游客  05-18 17:45

    yjhercules 終極殺人王 :

    cs1.5叫垃圾 
    重返德軍 叫垃圾
    薩姆叫垃圾 
    薩姆的強大在于世博會 克羅地亞館 把這個游戲做為國家象征 
    想想哪個游戲能代表國家 做為代表

    光明記憶 超能評價不錯我才玩的
    確實是不錯 劇情好 缺點就是 準星不好
    05-18 16:35 已有3次舉報
  • 支持(0)  |   反對(3)  |   舉報  |   回復
  • 你才是垃圾。

    已有3次舉報

    支持(6)  |   反對(0)  |   舉報  |   回復

    28#

  • yjhercules終極殺人王 05-18 16:35

    yjhercules 終極殺人王 :

    你要明白 代碼是適合所有顯卡的
    驅動在進行是沒有判斷 2060 跑什么優勢
    680跑什么優勢
    都是一樣的

    只不過2060 多了個一條件觸發 就是支持光反

    因為nv都是一個底層
    區別就是結構變化
    代碼不會考慮結構
    只是把數據送入gpu
    gpu根據自己的結構 進行相應單位運算

    所以gef2 mx 玩的游戲 一樣 1060 能正宗
    因為他們是一個 父

    而ati amd 當年鐳le玩不定的游戲
    現在就是vega 也一樣玩不定
    因為他們的你親是 rage128
    除非 是雜交另一個父
    可以 雜交是不可能的
    05-17 23:01 已有3次舉報
  • 支持(1)  |   反對(0)  |   舉報  |   回復
  • cs1.5叫垃圾 
    重返德軍 叫垃圾
    薩姆叫垃圾 
    薩姆的強大在于世博會 克羅地亞館 把這個游戲做為國家象征 
    想想哪個游戲能代表國家 做為代表

    光明記憶 超能評價不錯我才玩的
    確實是不錯 劇情好 缺點就是 準星不好

    已有3次舉報

    支持(0)  |   反對(3)  |   舉報  |   回復

    27#

  • 游客一代宗師 05-18 11:53

    yjhercules 終極殺人王 :

    你要明白 代碼是適合所有顯卡的
    驅動在進行是沒有判斷 2060 跑什么優勢
    680跑什么優勢
    都是一樣的

    只不過2060 多了個一條件觸發 就是支持光反

    因為nv都是一個底層
    區別就是結構變化
    代碼不會考慮結構
    只是把數據送入gpu
    gpu根據自己的結構 進行相應單位運算

    所以gef2 mx 玩的游戲 一樣 1060 能正宗
    因為他們是一個 父

    而ati amd 當年鐳le玩不定的游戲
    現在就是vega 也一樣玩不定
    因為他們的你親是 rage128
    除非 是雜交另一個父
    可以 雜交是不可能的
    05-17 23:01 已有3次舉報
  • 支持(1)  |   反對(0)  |   舉報  |   回復
  • 說明游戲認爹而已,你真天才N年前都垃圾游戲你覺得新顯卡跑不了?不認爹你NV照樣跑不了。

    已有1次舉報

    支持(1)  |   反對(0)  |   舉報  |   回復

    26#

  • Y神愛AMD博士 05-18 09:30

    yjhercules 終極殺人王 :

    你要明白 代碼是適合所有顯卡的
    驅動在進行是沒有判斷 2060 跑什么優勢
    680跑什么優勢
    都是一樣的

    只不過2060 多了個一條件觸發 就是支持光反

    因為nv都是一個底層
    區別就是結構變化
    代碼不會考慮結構
    只是把數據送入gpu
    gpu根據自己的結構 進行相應單位運算

    所以gef2 mx 玩的游戲 一樣 1060 能正宗
    因為他們是一個 父

    而ati amd 當年鐳le玩不定的游戲
    現在就是vega 也一樣玩不定
    因為他們的你親是 rage128
    除非 是雜交另一個父
    可以 雜交是不可能的
    05-17 23:01 已有3次舉報
  • 支持(1)  |   反對(0)  |   舉報  |   回復
  • 請大家對【yjhercules】這個ID持娛樂態度
    https://www.pc426.com/d/49570-49570/117

    已有1次舉報

    支持(2)  |   反對(0)  |   舉報  |   回復

    25#

  • yjhercules終極殺人王 05-17 23:01

    yjhercules 終極殺人王 :

    負優化就是 amd自己相對于自己論
    不能否認nv 某個別驅動會某個游戲速度變低

    但就幾個nv驅動 連續觀察 相對來說偏差不大

    今天最新驅動配gtx680 薩姆3 最后一關 基本穩定在60幀

    再一看游戲設置16af 4x aa 2x 陰影反鋸齒
    全關了 100多幀不是事

    所以說 我給nv提供一個建議
    跟游戲商合作
    不同顯卡 在不同顯示器 配方 用戶可以選擇
    而且用戶可以共享 游戲設置配方
    05-17 21:59 已有3次舉報
  • 支持(1)  |   反對(3)  |   舉報  |   回復
  • 你要明白 代碼是適合所有顯卡的
    驅動在進行是沒有判斷 2060 跑什么優勢
    680跑什么優勢
    都是一樣的

    只不過2060 多了個一條件觸發 就是支持光反

    因為nv都是一個底層
    區別就是結構變化
    代碼不會考慮結構
    只是把數據送入gpu
    gpu根據自己的結構 進行相應單位運算

    所以gef2 mx 玩的游戲 一樣 1060 能正宗
    因為他們是一個 父

    而ati amd 當年鐳le玩不定的游戲
    現在就是vega 也一樣玩不定
    因為他們的你親是 rage128
    除非 是雜交另一個父
    可以 雜交是不可能的

    已有3次舉報

    支持(1)  |   反對(0)  |   舉報  |   回復

    24#

  • 游客一代宗師 05-17 22:52

    yjhercules 終極殺人王 :

    負優化就是 amd自己相對于自己論
    不能否認nv 某個別驅動會某個游戲速度變低

    但就幾個nv驅動 連續觀察 相對來說偏差不大

    今天最新驅動配gtx680 薩姆3 最后一關 基本穩定在60幀

    再一看游戲設置16af 4x aa 2x 陰影反鋸齒
    全關了 100多幀不是事

    所以說 我給nv提供一個建議
    跟游戲商合作
    不同顯卡 在不同顯示器 配方 用戶可以選擇
    而且用戶可以共享 游戲設置配方
    05-17 21:59 已有3次舉報
  • 支持(1)  |   反對(3)  |   舉報  |   回復
  • 680 再裝新驅動 里頭對680生效都新代碼完全沒有的,你就別整天惡心人用七年前都垃圾東西說跟新驅動了 人家早就放棄了更新了只是兼容更新,整天吹哪個破游戲

    已有1次舉報

    支持(1)  |   反對(0)  |   舉報  |   回復

    23#

  • yjhercules終極殺人王 05-17 21:59

    mulair 博士 :

    你比NV工程師睿智系列,9102年了還TM在這吹色彩,色彩說僅存在于模擬信號輸出,現在都數字輸出了,同樣是255的話你能看出差別算你牛。受不了睿智的智商,是割韭菜連智商也割掉了嘛?還肉眼可見,你真牛逼,你就是噴3.5G顯存都比這個靠譜,這跟負優化一樣,根本就是個只能證明你自己無知又可笑的想法。。。吹到現在色彩了,誰能拿出數據來,說nv顯卡色彩就是不行,你們的論據就是我朋友用過,我一眼就看出來了,諸如此類論據,不拿出數據光靠張嘴說話有用嗎?來校色儀數據,否則別BB。
    05-17 13:56 已有6次舉報
  • 支持(16)  |   反對(3)  |   舉報  |   回復
  • 負優化就是 amd自己相對于自己論
    不能否認nv 某個別驅動會某個游戲速度變低

    但就幾個nv驅動 連續觀察 相對來說偏差不大

    今天最新驅動配gtx680 薩姆3 最后一關 基本穩定在60幀

    再一看游戲設置16af 4x aa 2x 陰影反鋸齒
    全關了 100多幀不是事

    所以說 我給nv提供一個建議
    跟游戲商合作
    不同顯卡 在不同顯示器 配方 用戶可以選擇
    而且用戶可以共享 游戲設置配方

    已有3次舉報

    支持(1)  |   反對(3)  |   舉報  |   回復

    22#

  • 游客  05-17 14:41

    游客:

    680只能玩玩游戲 其他地方落后幾倍 有什么好吹的
    05-16 20:28 已有2次舉報
  • 支持(10)  |   反對(8)  |   舉報  |   回復
  • 本來就是民用游戲卡,不玩游戲做什么?AMD眼里只有挖礦?

    已有1次舉報

    支持(6)  |   反對(1)  |   舉報  |   回復

    21#

  • 游客  05-17 14:36

    游客:

    我想請問用N卡的朋友,真的感覺不到那被閹割的色彩和畫質嗎?難以理解世界上存在這樣蒙灰的眼睛。
    A卡如果也閹割畫質,幀率分分鐘暴漲。
    05-17 09:03 已有12次舉報
  • 支持(17)  |   反對(32)  |   舉報  |   回復
  • 我給你講原理:DP是數字接口,不是模擬口,一旦顯卡輸出的色彩數據不一樣,馬上就會被檢測到 ...

    支持(7)  |   反對(0)  |   舉報  |   回復

    20#

  • mulair博士 05-17 13:56

    游客:

    我想請問用N卡的朋友,真的感覺不到那被閹割的色彩和畫質嗎?難以理解世界上存在這樣蒙灰的眼睛。
    A卡如果也閹割畫質,幀率分分鐘暴漲。
    05-17 09:03 已有12次舉報
  • 支持(17)  |   反對(32)  |   舉報  |   回復
  • 你比NV工程師睿智系列,9102年了還TM在這吹色彩,色彩說僅存在于模擬信號輸出,現在都數字輸出了,同樣是255的話你能看出差別算你牛。受不了睿智的智商,是割韭菜連智商也割掉了嘛?還肉眼可見,你真牛逼,你就是噴3.5G顯存都比這個靠譜,這跟負優化一樣,根本就是個只能證明你自己無知又可笑的想法。。。吹到現在色彩了,誰能拿出數據來,說nv顯卡色彩就是不行,你們的論據就是我朋友用過,我一眼就看出來了,諸如此類論據,不拿出數據光靠張嘴說話有用嗎?來校色儀數據,否則別BB。

    已有6次舉報

    支持(16)  |   反對(3)  |   舉報  |   回復

    19#

  • Y神愛AMD博士 05-17 13:42

    yjhercules 終極殺人王 :

    手機拍呀
    也能發現在中線 兩邊明顯的區別

    就是這樣,基本沒有人再吵amd 畫質好了
    我現在用amd 都是手動 不默認
    默認就優化

    玩ATI AMD都知道的技巧
    05-17 13:09 已有3次舉報
  • 支持(0)  |   反對(2)  |   舉報  |   回復
  • 手機又不是校色儀。

    支持(2)  |   反對(0)  |   舉報  |   回復

    18#

  • yjhercules終極殺人王 05-17 13:09

    yjhercules 終極殺人王 :

    我是只比中間最均勻的那個塊
    一般校正像 要把屏幕分成幾個塊校
    我用正中間最穩定的比
    特別是田字型中線2側的 各2-5個像素點
    然后就是 各接一個信號點對比
    最終比出來的結果是 在屏幕最中間的取樣塊
    中 明顯看出在橫和堅中線 這十字線相近區域的區別

    當然這是紅色
    至于6基色
    除了紅 變化是不大的
    藍和綠 nv amd 差不太多

    想試么,我現在還能用27的lg4k測試
    這次可以顯示3個1080p信號
    取一個INTEL 的 取一個NV 取一個amd
    在3個信號邊緣就能看出區別
    這邊緣只看 橫和豎中線附近
    4角肯定是不勻
    相對2條中線集合的屏幕中間是最穩定的
    05-17 11:29 已有4次舉報
  • 支持(0)  |   反對(3)  |   舉報  |   回復
  • 手機拍呀
    也能發現在中線 兩邊明顯的區別

    就是這樣,基本沒有人再吵amd 畫質好了
    我現在用amd 都是手動 不默認
    默認就優化

    玩ATI AMD都知道的技巧

    已有3次舉報

    支持(0)  |   反對(2)  |   舉報  |   回復

    17#

  • Y神愛AMD博士 05-17 11:49

    yjhercules 終極殺人王 :

    我是只比中間最均勻的那個塊
    一般校正像 要把屏幕分成幾個塊校
    我用正中間最穩定的比
    特別是田字型中線2側的 各2-5個像素點
    然后就是 各接一個信號點對比
    最終比出來的結果是 在屏幕最中間的取樣塊
    中 明顯看出在橫和堅中線 這十字線相近區域的區別

    當然這是紅色
    至于6基色
    除了紅 變化是不大的
    藍和綠 nv amd 差不太多

    想試么,我現在還能用27的lg4k測試
    這次可以顯示3個1080p信號
    取一個INTEL 的 取一個NV 取一個amd
    在3個信號邊緣就能看出區別
    這邊緣只看 橫和豎中線附近
    4角肯定是不勻
    相對2條中線集合的屏幕中間是最穩定的
    05-17 11:29 已有4次舉報
  • 支持(0)  |   反對(3)  |   舉報  |   回復
  • 靠你肉眼測個毛。

    支持(4)  |   反對(1)  |   舉報  |   回復

    16#

  • Elwin博士 05-17 11:44

    Elwin 博士 :

    y神這話說的對,s3,intel,nvidia,ati,matrox我都用過,只有ati默認灰度是修正過的,其他的都在原點。
    05-17 11:42 已有1次舉報
  • 支持(3)  |   反對(2)  |   舉報  |   回復
  • 而且只有radeon是修正過的,firegl又回到原點了。

    已有1次舉報

    支持(0)  |   反對(2)  |   舉報  |   回復

    15#

  • Elwin博士 05-17 11:42

    yjhercules 終極殺人王 :

    你看看INTEL的顯卡就知道了
    和nv是一個色

    amd的我對比不
    一個顯示器 接2個顯卡信號
    一個nv 一個amd
    結果在最穩定中間區域
    明顯看出 amd的 紅是太艷了
    為什么
    有人用amd專業卡測試過
    專業卡的amd的色和nv的卡是一樣
    那也就是說amd的民用卡優化輸出
    這不是新聞 10多年就有了
    看了好就用。
    也不用bs 人家nv的卡
    因為 搞專業色的nv專業卡有的是
    畢竟人家nv要遵守的 色彩標準協會的準則
    不然誰買買的顯卡

    在3原色下 明顯看出amd的紅是過渡艷的
    05-17 11:04 已有10次舉報
  • 支持(0)  |   反對(6)  |   舉報  |   回復
  • y神這話說的對,s3,intel,nvidia,ati,matrox我都用過,只有ati默認灰度是修正過的,其他的都在原點。

    已有1次舉報

    支持(3)  |   反對(2)  |   舉報  |   回復

    14#

  • Elwin博士 05-17 11:34

    游客:

    我想請問用N卡的朋友,真的感覺不到那被閹割的色彩和畫質嗎?難以理解世界上存在這樣蒙灰的眼睛。
    A卡如果也閹割畫質,幀率分分鐘暴漲。
    05-17 09:03 已有12次舉報
  • 支持(17)  |   反對(32)  |   舉報  |   回復
  • 你跑到這里問我們之前,建議你郵件去問問國內外各個影視游戲工作室,為什么你們都用n卡,是你們眼瞎嗎?

    支持(6)  |   反對(2)  |   舉報  |   回復

    13#

  • yjhercules終極殺人王 05-17 11:29

    yjhercules 終極殺人王 :

    你看看INTEL的顯卡就知道了
    和nv是一個色

    amd的我對比不
    一個顯示器 接2個顯卡信號
    一個nv 一個amd
    結果在最穩定中間區域
    明顯看出 amd的 紅是太艷了
    為什么
    有人用amd專業卡測試過
    專業卡的amd的色和nv的卡是一樣
    那也就是說amd的民用卡優化輸出
    這不是新聞 10多年就有了
    看了好就用。
    也不用bs 人家nv的卡
    因為 搞專業色的nv專業卡有的是
    畢竟人家nv要遵守的 色彩標準協會的準則
    不然誰買買的顯卡

    在3原色下 明顯看出amd的紅是過渡艷的
    05-17 11:04 已有10次舉報
  • 支持(0)  |   反對(6)  |   舉報  |   回復
  • 我是只比中間最均勻的那個塊
    一般校正像 要把屏幕分成幾個塊校
    我用正中間最穩定的比
    特別是田字型中線2側的 各2-5個像素點
    然后就是 各接一個信號點對比
    最終比出來的結果是 在屏幕最中間的取樣塊
    中 明顯看出在橫和堅中線 這十字線相近區域的區別

    當然這是紅色
    至于6基色
    除了紅 變化是不大的
    藍和綠 nv amd 差不太多

    想試么,我現在還能用27的lg4k測試
    這次可以顯示3個1080p信號
    取一個INTEL 的 取一個NV 取一個amd
    在3個信號邊緣就能看出區別
    這邊緣只看 橫和豎中線附近
    4角肯定是不勻
    相對2條中線集合的屏幕中間是最穩定的

    已有4次舉報

    支持(0)  |   反對(3)  |   舉報  |   回復

    12#

加載更多評論

我來評論

熱門文章
1微星Prestige P100桌面主機開售:搭載i9-9900KF、RTX 2080 Ti,售價三萬
2三星Galaxy Note10系列國內正式發布:驍龍855 SoC、Note10+ 5G版7999元
3Steam中國來了!正式名“蒸汽平臺”,首發40款游戲與程序
4索尼專利泄露PS5開發機外觀:看上去非?!癡5”,開發者證實
5銳龍7 3800X最大頻率在不同主板上表現不一,原因不明
6微星發布新款Prestige筆記本:首批搭載英特爾第十代Comet Lake處理器
7Intel推出Comet Lake系列移動處理器:拓展十代酷睿產品線
8戴爾發布靈越 7000系列筆記本:鎂合金機身、重1kg、Comet Lake-U處理器
9Geekbench上出現了i9-9900T的跑分:顯示其默頻2.1GHz,最高睿頻4.4GHz