丰满女人又夹又紧又丰满/国产精品久久久久久久久福交 /黄色va视频/姜恩惠的29分钟激情视频

English 服務熱線: 400-610-7333

2023年GPU行業深度研究 理解GPU的核心是性能+生態 2023-07-25 13:03  作者或來源:中信證券

核心觀點:

理解GPU的核心:性能先進性+生態計算壁壘。GPU物理性能取決于微架構、制程、流處理器數量、核心頻率等,其中微架構是核心點。我們認為微架構的快速創新迭代是GPU性能領 先的前提,其圖形渲染單元和通用計算單元設計向著更多、更專、更智能的方向優化迭代。根據應用場景來劃分,數據中心要求強算 力、高并發吞吐量;游戲業務要求浮點運算能力強、訪存速度快;圖形顯示要求圖顯專業化、精細化等。

生態:GPU生態構筑通用計算極深壁壘,CUDA生態占據大部分市場,類CUDA生態蓬勃發展。GPU生態由上層算法庫,中層接口、驅動、 編譯器和底層硬件架構三大部分基本構成。GPU研發難度在圖形渲染硬件層面和通用計算軟件生態層面,在IP、軟件棧方面研發門檻較高, 需要較長的積累,先發優勢明顯。CUDA生態從2006年推出至今,經過不斷發展完善,幾乎已在行業生態內處于壟斷地位,目前ROCm等 兼容Cuda的類計算生態蓬勃發展并處于快速推廣階段。

海外復盤:NVIDIAAMDATI)的競爭貫穿GPU發展歷程,架構創新升級和新興AI等領域前瞻探索是領跑的關鍵。NVIDIA長期居于GPU市場領導地位,近年AMD憑借RDNA架構在游戲市場強勢崛起。Verified Market Research數據顯示,2022年全球獨 立GPU市場規模約448.3億美元,NVIDIAAMD的市場份額占比約為8:2。根據JPR數據,NVIDIA憑借自身性能領先和CUDA生態優勢性 始終占有GPU領域超50%的市場份額,數據中心業務更是全面領先,在游戲顯卡領域,近年AMD憑借RDNA系列架構強勢崛起。

NVIDIA先后與AMD等企業在性能方面競爭博弈,架構創新升級和新興領域前瞻探索是領跑GPU行業的關鍵。NVIDIA憑借性能領先長期占 據超五成市場份額,AMDATI)也曾因架構出色、性能驚艷實現反超。同時NVIDIA早在2006年前瞻性布局通用計算、構建CUDA生態, 為如今AI&數據中心領域的全面領先構筑牢固的壁壘。NVIDIA積極布局異構芯片、汽車、元宇宙等新市場,尋找新的強有力業務增長點。

國內GPU市場:各應用場景市場廣闊,國內廠商大有可為。需求端1—AI:數據中心和終端場景不斷落地對計算芯片提出更多更高需求。新一輪AI對算力需求遠超以往:ChatGPT類語言大模型底層 是2017年出現的Transformer架構,該架構相比傳統的CNN/RNN為基礎的AI模型,參數量達到數千億,對算力消耗巨大,對算力硬件有大 量需求。甲子光年預測,中國AI芯片市場規模2023年達到557億元。AI芯片可進一步細分為云端和終端,中國云端芯片市場規模較大,甲 子光年預計2023年增長至384.6億元,對應復合年增速到52.8%;終端芯片市場規模甲子光年預計2023年增長至173億元,對應年復合增 長率達62.2%,伴隨各AI終端落地預計將保持較快增長速度。

需求端2—汽車:汽車智能化浪潮下域控制器GPU市場前景廣闊。 自動駕駛和智能座艙是智能汽車中具有廣闊前景的方向。蓋世汽車數據 預計,2025年自動駕駛域控制器出貨量將達到432萬臺,每臺自動駕駛域控制器配備1-4片高性能計算GPU;智能座艙域控制器出貨量達 到528萬臺,絕大多數智能座艙域控制器配備1GPU。自動駕駛技術不斷提高和座艙進一步智能化拉動汽車GPU市場規模快速擴張。 需求端3—游戲:游戲玩家人數持續增長,游戲GPU市場穩中有升。Newzoo Expert數據顯示全球游戲玩家人數在2021年已達到30.57億人, 且預計2020-2025年全球游戲玩家人數復合年增率為4.2%;游戲市場內,游戲機和PC兩大主體出貨量再創新高,游戲機三大巨頭2021年 出貨量高達4008萬臺;2021Q4全球PC GPU出貨量(包括集成和獨立顯卡)高達11000萬片。

1、理解GPU的核心:性能+生態

1.1GPU定位:計算機圖形處理以及并行計算的核心

GPU全稱是Graphic Processing Unit,即圖形處理單元,是計算機顯卡的核心。 GPU是計算機的圖形處理以及并行計算內核。它的主要功能可以分為:1)圖形圖像渲染計算 GPU2)作為運算協作處理器 GPGPU GPU的功能主要集中于執行高度線程化、相對簡單的并行任務處理。 GPU vs GPGPUGPGPU全稱通用GPU,運用CUDA及對應開放標準的OpenCL實現通用計算功能運算,能夠輔助CPU進行非圖形相關程序執行。 由GPU性能拓展至計算密集領域,將GPU強大的并行運算能力運用于通用計算領域。多側重科學計算、AI領域、大數據處理、通用計算、 物理計算、加密貨幣生成等領域。

依據接入方式不同分為:獨立GPU和集成GPU1)獨立GPU:大部分封裝于獨立顯卡電路板上,使用PCIE接口和特定顯存,不受空間和供電限制,性能相對更好、渲染畫質更佳。主 要廠商包括AMDRadeon系列)、NVIDIAGeforce系列)。2)集成GPU:通常未擁有獨立顯存,集成于CPU內部,與CPU共同使用 Die和系統內存,節省空間占位和制作難度,價格較低、兼容性更佳且供電量少。主要廠商包括IntelHD系列)、AMDAPU系列)。

依據應用端不同分為:PC GPU、服務器GPU和移動GPU1PC端:集成GPU主要運用于提高輕辦公效率,對性能要求較低;獨立GPU主要運用于圖形設計、提高圖片制作清晰度以及3A游戲繪 圖渲染能力,對性能要求較高。2)服務器端:主要進行專業可視化處理、AI訓練、AI推斷的深度學習、提高計算運行能力以及視頻編解 碼等功能,以獨立GPU為主。3)移動端:提高游戲體驗、提升游戲處理性能,應用場景包括AR、桌面、云計算、數據中心等。受移動 端功耗和體積限制,一般為集成GPU

1.2GPU性能影響因素:微架構、制程、核心頻率

微架構:又稱為微處理器體系結構,是硬件電路結構,用以實現指令執行。 制程:指GPU集成電路的密集度。在晶體管硬件數量一定的情況下,更精細的制程能夠減少功耗和發熱。現階段GPU主 流最先進工藝制程為5nm。 核心頻率:代表GPU顯示核心處理圖像頻率大小/工作頻率,能夠反映顯示核心的性能。

圖形處理器單元數量:指GPU內部圖形處理單元,涵蓋光柵單元(ROP)和紋理單元(TMU)等數量。 光柵單元(ROP):進行光線、反射計算,負責游戲中高分辨率、高畫質的效果生成。 紋理單元(TMU):能夠對二進制的圖形進行一系列翻轉、縮放變化,再將其紋理傳輸至3D平面模型中。CUDA核數:作為GPU內部的流處理器,是主要的計算單元,CUDA核數越多,GPU性能等級越高。Tensor核數:能夠進行張量核加速GEMM計算以及加速卷積和遞歸神經網絡運行,Tensor核數越多,在人工智能、深度 學習領域的性能越強。

顯存容量:顯存作為GPU核心部件,用以臨時存儲未處理數據。 顯存容量的大小對于GPU存儲臨時數據的多少起決定性作用,在GPU核心性能能夠提供充足支撐前提下,越大的顯存容量能夠減少數據 讀取次數,減少延遲出現。 顯存位寬:是GPU在單位時鐘周期內傳送數據的最大位數,位數越大GPU的吞吐量越大。 顯存頻率:顯存數據傳輸的速度即顯存工作頻率,通常以MHz為顯存頻率計數單位。 顯存帶寬:顯存帶寬=顯存頻率X顯存位寬/8,為顯存與顯卡芯片間數據傳輸量。

PolyMorph Engine(黃色部分,多形體引擎),是全球首款實現了可擴展幾何學流水線的重要元件。主要負 責頂點拾取(Vertex Fetch)、細分曲面(Tessellation)、 視口轉換(Viewport Transform)、屬性設定(Attribute Setup)、流輸出(Stream Output)五個方面的處理工作。 在圖形渲染流水線中: Vertex Fetch通過三角形索引取出三角形數據。 Viewport Transform負責模塊處理已完成vertex-shader的所 有指令,進行裁剪三角形,準備柵格化。 Attribute Setup確保經過插值后的vertex-shader數據在pixelshader中的可讀性。

微架構未來方向:更多、更專、更智能

更專:圖形渲染能力更精細,通用計算能力更高效。 圖形渲染領域:采用光線追蹤技術,相較傳統光柵化渲染方式,光線追蹤采用基于物理渲染方式,使得所實現的效果更加接近顯示,具 有更加逼真的圖顯能力。 通用計算領域:目前國際各大廠商均推出GPGPU計算解決方案,大規模擴展計算能力的高性能計算。例如:1ATI Stream:為程序員 提供SDK開發工具包以協同進行GPU計算。2NVIDIA CUDA:推出統一計算架構,由管線分工式設計轉變為統一化的處理器設計,學 習成本較低,能夠通過CC++編程語言進行程序編寫。

更智能:GPU AI運算能力上升。 GPUAI領域得到廣泛的應用,包括自動駕駛、醫療影像分析、人工智能計算能力、金融模型建立等領域,如第三代的張量單元相較于 上代在吞吐量上提升了1倍。 GPU自身結構特點決定其在AI的發展方向:1)多線程,計算單元數量多,并行計算方式能夠同時計算大量數據。2)擁有更直接、迅速 訪問緩存的能力。3)擁有更高精度的浮點算力,能夠更佳適配于推理訓練、深度學習。

應用場景:數據中心、游戲業務、圖形顯示、OEM、加密貨幣

GPU技術不斷發展,GPU的應用場景也隨之不斷拓寬,不僅包含圖形處理,還在AI、邊緣計算等新領域發揮重要作用。 圖形顯示是GPU最基本的功能。GPU的誕生原因就是分擔CPU計算量,憑借其處理并行計算的優勢承擔圖像信息的運算工作。在游戲畫面顯示、圖像運算等領域廣泛應 用。 GPGPU被視為AI時代的算力核心。應用于人工智能場景的服務器通常搭載GPUFPGAASIC等加速芯片。加速芯片和中央處理器的性能結合支撐高吞吐量的運算需求, 為圖形視覺處理、語音交互等場景提供算力支持,已經成為人工智能發展的重要支撐力量。GPU由于在架構設計上擅長進行大量數據運 算,被廣泛應用于人工智能計算中。在人工智能的應用和研究、智能安防、邊緣計算、無人駕駛等領域發揮作用。

應用場景:人工智能芯片GPGPUFPGAASIC的選擇

GPGPU:為通用圖形處理器,擅長圖形處理,粗粒度并行技術。特點為擁有高靈活性、運用并行結構、在圖形和復雜算法上效率較 高;缺點為價格貴且功耗高。 FPGA:為現場可編程邏輯陣列,擅長于算法更新頻繁的專用領域。特點為靈活性適中、可以同時進行數據并行和任務并行計算、制作成 本低于ASIC、定制化、功耗低。在國內多用于芯片驗證。 ASIC:為專用集成電路,應用于市場需求量大的專用領域。指應特定用戶要求和特定電子系統的需要而設計、制造的集成電路,特點是 靈活性較低、高性能、成本高、可靠性高。缺點是算法相對固定、開發時間成本高。

1.3GPU指令集:GPU進行圖形渲染和通用計算的指令集合

GPU指令集本質是硬件執行功能的機器碼。指令是計算機運行的最基本工作單位,是GPU功能實現的重要基礎,通常包括指令格式、尋址方式和數據形式等。 GPU指令集是GPU中用以計算和控制系統的指令集合,指令集的先進與否直接關系到GPU性能的高低。操作系統通過指令集對硬件進行 管理和資源分配,并規范程序按認可方式編譯運行。GPU指令集分類包括PTXCUDA SASS指令集等。

指令集相關性質: 指令集本身在特定架構改變下會表現為指令性能變化,而本身的編碼和功能并沒有發生改變。 兼容性:經過CUDA CC++編譯完成后,會同時生成與SM單元對應的PTXSASS代碼。 指令執行吞吐是評價GPGPU執行的有效指標,GPU指令吞吐一般用每單位SM在一周期內執行的指令數量計算 n SASS指令集分類:主要包括Predicate操作指令、Float指令、Integer指令、格式轉化/數據移動/內存操作/跳轉分支指令和Uniform DataPath指令。

MOV: 能夠完成基本傳送指令。MOV指令是編程中最基本的指令,能夠將數據從起始源地址傳送到目標地址。功能范圍覆蓋立即數傳送、寄存器傳送、儲存器傳送、段 寄存器傳送。 n MUFU: 作為SASS指令集中計算超越函數的重要工具。 超越函數指的是相對有限次加減乘除等組合而言,硬件上無法用多項式表示的函數需要通過該指令進行近似計算,若對精度有進一步要 求,還需要調用數學函數庫中其他軟件。完善的GPU生態體系能夠兼容不同的軟件、硬件平臺,使得GPU性能得到最佳釋放。GPU生態的由三大部分基本構成:1)上層圖形引擎、算法庫。2)中層標準API接口適配各類驅動、編譯器。3)底層硬件/指令集架構。

GPU生態體系:構筑行業壁壘的基石

IP研發難度高: IP研發難度大、需要多年沉淀才能產出穩定性較佳的產品。目前GPU領域中,想要短期內產出需要依賴外部IP授權。市場上大多公司使 用Imagination提供的IP,即在購買商用GPU IP之后自行修改迭代。以蘋果芯片IP專利為例,蘋果在A10之前處理器芯片都是采用 lmaginationIP。 軟件門檻高: 計算機芯片除了硬件之外,還要求有與之配套的軟件體系,而GPU軟件體系復雜,涵蓋各類圖形API、計算接口、基礎庫、應用對接適 配等等。NVIDIA在各類軟件驅動測試上已投入大量時間,形成較強的生態效應。

規模化商用難:要實現規模化商用,就需要廠商實現軟硬件技術生態完整部署。由于行業在生態建設上先發優勢明顯,NVIDIA通過早期與客戶企業的平 臺適配、軟件開源合作,較好的用戶體驗加強了客戶粘性,使新的競爭企業難以進行轉移。市場認可度:市場認可度一方面需要生產商具備生產高品質產品的實力,另一方面需要用戶經過一定時間使用形成反饋累積為企業信譽。在GPU市場 內,長期以來,AMDNVIDIA兩大產商占據了主要市場份額,也相應形成了較高的市場認可度,客戶在選擇產品時普遍優先考慮這兩大 產商的產品;其他廠商的產品,由于未使用過且市場認可度不高,存在較大的不確定性,客戶選購意愿較低。

2、他山之石:Nvidia/AMD競爭啟示架構創新升級和新興領域前瞻探索是主旋律

2.1、總覽:NVIDIA經歷風雨遙遙領先,AMDATI)再顯崢嶸

總體而言,NVIDIA引領GPU行業發展數十年,大多數時期技術和市場份額均領先;AMDATI)長期與保持NVIDIA競爭, N/A卡之爭愈演愈烈。 NVIDIA市場份額雖有波動,但長期高于50%,與其產品性能優勢和生態構建優勢密不可分。2006年起,英偉達GPU架構保持約每兩年 更新一次的節奏。在這一節奏下,英偉達代際之間產品性能提升顯著,生態構建完整,Geforce系列產品市占率長期超過Radeon鐳龍系 列,NVIDIA牢牢把握市場龍頭地位。2019年后,AMD憑借RDNA架構再度崛起。

NVIDIAAMDATI)等企業構筑GPU發展主旋律

1999NVIDIA提出GPU概念,GPU已經有20余年發展歷史。1995年,3Dfx發布第一款消費級3D顯卡,拉開圖形處理芯片的發展序幕。1999年,NVIDIA提出GPU概念,奠定其GPU行業霸主地位, 自此AMDATI3Dfx等企業與NVIDIA合力推動GPU快速發展。 NVIDIA率先構筑通用計算的CUDA生態,引領GPU的行業革命;AMDATICPUGPU雙線并行緊隨其后。如今人工智能高速發展,幾乎應用于各行各業,GPU是目前應用最廣的AI芯片。NVIDIA把握游戲、數據中心市場機遇;AMD加速提升架 構性能緊隨其后。

AMDATI時代開端奠定市場基礎

AMD顯卡發展可大致劃分為兩階段:第一階段ATI時代從1985年至2006年,第二階段從2006年至今為AMD時代— Radeon系列持續迭代更新。自早期開始,AMD分為兩路研發,兼顧高端顯卡市場和低端顯卡市場,其中,高端產品如Radeon 8500Radeon X1800 XT等;從高端 顯卡中衍生出多款低端顯卡產品,包括Radeon 90009000 Pro91009200以及92502012年以來,AMD在架構上保持創新態勢,制程引領行業先進性。2012年發布Radeon HD系列,AMD在架構上實現創新,推出GCN架構,并且是業界第一款采用28納米工藝制程的GPU圖形芯片。在圖 形渲染和通用計算領域性能均領先市場內競爭對手。 2019年,AMD推出RDNA架構,同時兼容原有GCN架構,在性能、功耗、能效等多方面實現超越,正式開啟第五代架構革新之路。

2.21962-1995年:圖形處理技術不斷發展,3DfxVoodoo一枝獨秀

1962年起,計算機圖形學不斷發展,圖形處理技術實現從2D3D的突破。1962年麻省理工學院博士伊凡蘇澤蘭奠定了計算機圖形學基礎;1984年,SGI公司推出了面向專業領域的高端圖形工作站,俗稱圖形加 速器,是首個專門的圖形處理硬件。1994年,3D Labs發布GLINT 300SX, 是PC最早的3D硬件加速圖形芯片,從此開啟3D顯卡時代。1995年,3Dfx發布Voodoo圖形芯片組配和Glide API接口,一度統治市場。Glide3DfxVoodoo打造的底層3D API,是第一個在PC游戲領域得到大范圍使用的程序接口,使得Voodoo無須硬件廠商額外提供API 就可以直接開發游戲,具有易用性和穩定性。NVIDIA同期的riva 128性能與其有差距。 Ø 當時的頂級游戲和部分PC游戲基本都支持Glide。因此即使Voodoo的價格遠遠高于市場上其他產品,也深受消費者追捧。

3Dfx Voodoo系列后續產品被NVIDIA反超,開始由盛轉衰。1996年,3Dfx憑借Voodoo成為全球3D顯卡和GPU制造領域的壟斷者。1997年,NVIDIA推出的NV 3RIVA 128)有128bit2D3D加 速圖形核心,采用0.35微米工藝,支持微軟Direct 3D接口,且性價比高于Voodoo,被OEM廠商廣泛使用。 1998-1999年,NVIDIA推出NV4性能擊敗Voodoo3,隨后3DfxVoodoo4延遲發布、Voodoo5由于能耗大、散熱高敗給NVIDIA

19998月,NVIDIA公司發布圖形芯片Geforce 256,首次提出GPU的概念。Geforce 256采用技術包括硬件變換、“T&L”、立方環境材質貼圖和頂點混合、凹凸映射貼圖、雙重紋理四像素256位渲染引擎、紋理壓 縮等,兼容Direct XOpen GL,被稱為世界上第一款GPU。此前如頂點變換必須在CPU中完成,光柵化后像素有限等,而GPU將這些 功能獨立出來,使顯示核心與CPU并列成為計算機核心,大大減少CPU的運算壓力。

1999年,NVIDIA崛起,擊敗并收購難以為繼的3Dfx Ø 1999年,NVIDIAGeforce 256奠定了NVIDIAGPU市場的領先地位。與此同時的3DFX由于一系列決策失誤,由盛轉衰。 20001215日,Nvidia低價收購3Dfx圖形處理相關所有產業。 3Dfx的失敗可以歸因于戰略和產品策略問題 Ø 戰略失誤:芯片廠商涉足板卡制造領域面臨困難。3Dfx收購板卡制造商STB,希望獨自生產Voodoo顯卡,但二者的合作并沒有表現出 1+1>2的效果,反而拖慢新品發布進度,令3Dfx丟掉不少市場份額。同時失去原有板卡廠商合作伙伴,DIAMONDGIGABYTE CREATIVEELSA都加入NVIDIA陣營。

產品策略問題:Voodoo3Voodoo2相比性能進步很小,只是換了馬甲;Voodoo4Voodoo5不支持硬件轉換和TV輸出功能,失去了DVD 和家庭影院市場;Voodoo4Voodoo5不支持DDR內存,而自身適配的SDRAM在性價比上輸給NVIDIADDR內存,再次流失市場份額。

2000年顯卡市場格局洗牌,ATIRadeon 9700強勢崛起。2000年,ATI發布Radeon 256180nm工藝,內有3000萬顆晶體管,具備在當時屬于先進技術的幾何變形、圖像剪切功能、光照效果, 性能優于Nvidia同代的Geforce 256。自此,PC端獨立顯卡市場形成Radeon系列與Geforce系列對峙的局面。2002年,ATI發布R 300(即Radeon 9700)支持DirectX9.04頂點著色器、8像素流水線、256DDR內存總線;2003年發布Radeon 9800pro,性能均超過NvidiaGeforce FX5900ATI逐步站穩腳跟。隨后NVIDIAGeforce FX6800又在性能反超Radeon 9800。在此 之后,ATI真正與NvidiaGPU市場平分秋色,二者產品性能相互追趕。

NVIDIA遇強力對手,市場份額跌破50%ATI獲微軟XBOX 2主機圖形芯片訂單。在ATI Radeon 9700XBOX 2 訂單的幫助下,ATI市場份額最高達到55%,而NVIDIA市場份額跌破50%,為NVIDIA迄今為止最低點。 微軟和Nvidia共同研發微軟第一代XBOX的圖形處理器芯片,而2003ATI獲得第二代XBOX的圖形處理器訂單,股價因此由上漲1美元到 13.2美元,并在2004年順利完成該訂單顯卡的開發工作,市場份額有所上漲。

2006年起,英偉達GPU架構保持約每兩年更新一次的節奏,代際之間產品性能提升顯著,性能和市場份額均領先AMD 2006年,英偉達推出了CUDA編程軟件,使GPU成為通用并行數據處理加速器,并逐步構筑起CUDA生態。 CUDA讓顯卡可以用于通用并行計算和其他非圖形計算,使得GPU能夠承擔和CPU一樣的計算任務。程序員可以通過CUDA直接對GPU 進行編程。為NVIDIA的數據中心業務高速擴張打下基礎。 CUDA包括硬件平臺和軟件棧(軟件集合)兩層含義,加上第三方應用及工具的擴展,形成從開發到應用的CUDA生態。CUDA生態也成 為NVIDIA的生態護城河。

架構創新升級和新興領域前瞻探索是領跑GPU行業的關鍵。NVIDIA堅持每兩到三年完成一次架構迭代,持續保持領先的圖顯和計算性能:2001年發布Kelvin2003年發布Rankine2004年發布 Curie2006年發布Tesla2009年發布Fermi2012年發布Kepler2014年發布Maxwell2016年發布Pascal2017年發布Volta2018 年發布Turing2020Ampere2022年先后發布HopperAda lovelace。架構創新迭代高效,架構之間性能提升顯著。而AMDATI) 也曾憑借Radeon 9700Radeon 9800強勢崛起,近些年的RDNA架構也令其市場份額快速提高。

NVIDIA前瞻性布局新興領域數據中心、自動駕駛等領域,推動業績爆發增長。其自2006年開始構筑CUDA生態并推出Tesla通用計算 GPU架構,從以硬件為核心的企業變成以軟硬件平臺為核心的科技公司,前瞻性的布局使其在計算生態上構筑了極深的壁壘,占據了絕 大部分市場。近年公司開始布局元宇宙等領域,持續探索新興領域以保持GPU行業的龍頭地位。

未來競爭:NVIDIA維持游戲和數據中心領先地位,同時瞄準元宇宙、智能汽車市場

NVIDIA各主要業務線持續發力,以技術創新技術保持行業領先,開啟元宇宙布局。游戲:NVIDIA新發布Ada Lovelace架構的4000系列GPU有極強的光追性能,比前代提高1-3倍,性能顯著領先AMD,但成本也顯著提高。汽車:在2022 GTC大會上發布的NVIDIA DRIVE Thor SoC系統,算力達到2000TOPS,公司計劃在2025年裝車。Thor可以將智能汽車 的所有功能集成在單個AI計算器上,將顯著降低成本,對智能座艙領域將是顛覆性影響。元宇宙:Omniverse是為元宇宙打造的軟硬件方案,彰顯其在元宇宙領域提前布局的野心。使用者可以在Omniverse中創建虛擬世界,而 他們所創建的虛擬物體也會成為NVIDIA元宇宙生態的重要組成部分。與NVIDIAGPUCPU等硬件基礎一起,共同構成NVIDIA元宇宙 的一站式云服務體系。

云端芯片市場格局未定,NVIDIA實行“GPU+CPU+DPU”路線,布局云端異構AI芯片。2021年的GTC大會NVIDIA推出面向數據中心AI和高性能計算的自研的采用ArmNeoverse架構的Grace芯片。并取得ARM授權協議,可開 發ARM架構CPU芯片。2019年,NVIDIA70億美元收購Mellanox2020年推出BlueField-2 DPU,成功布局DPU業務。

未來競爭:AMD結合自身CPU優勢全方位布局AI芯片

2022619日,AMD講述其未來發展戰略,概述為技術和產品組合更新、擴大數據中心解決方案產品組合、加速打造 無所不在的 AI 領域領導地位、擴大PC領先、推動圖形解決方案發展勢頭。 AMD結合CPU優勢,GPUFPGAAPU業務多點布局搶占AI芯片行業先機。AMD希望未來將更多AI功能引入CPU的硬件層面中,如AVX-512 VNNI指令集。AMD認為,在CPU中運行大部分推理很重要并會是未來 趨勢。AMD預計明年發布全球第一個數據中心APU——Instinct MI300(此前該系列為GPU加速卡),面向訓練領域,結合使用Zen 4架 構的CPUCDNA 3架構的GPUAPU是將處理器和獨顯集成到一個晶片上,實現GPUCPU的融合。 AMD收購Xilinx(賽靈思)以更好地開展FPGA業務,補全FPGA領域的短板,擴大自身AI芯片市場。

3、國內市場:GPU細分市場前景廣闊,國內廠商大有可為

3.1GPU市場空間廣闊,國內企業規模逐步起量

2022年全球GPU市場規模達到448.3億美元,國內外市場空間正高速增長,年復合增長率達到32.8%Verified Market Research 數據顯示,2020年,全球GPU市場規模為254.1億美元,且該機構預計2028年市場規模將達到2465.1億美元, 對應年復合增長率達32.8%

國際獨立GPU市場由NvidiaAMD八二分成,國內市場中國企業體量快速增長 。 國際市場上,英偉達、AMD瓜分市場,Jon Peddie Research數據顯示2022Q1英偉達占據79%市場份額,AMD占據21%。英偉達在獨立 GPU領域一枝獨秀,AMD在集成GPU領域可與英偉達競爭。國內GPU龍頭企業景嘉微2022年上半年營業收入5.44億人民幣,2021年營業收入10.93億人民幣;2022年上半年海光 信息營業收入為25.3億元,而英偉達2022Q2營收為67億美元,2021NVIDIA中國區的營收約為71億美元。相比之下,國產廠商相對規 模暫時較小,未來成長空間廣闊。

GPU應用場景不斷擴大拉動GPU市場空間迅猛增長,根據Verified Market Research預測,2027年中國GPU市場規模將 會增長至345.57億美元。GPU市場主要應用場景可概括為:AI&數據中心、智能汽車、游戲。 AI&數據中心:新一輪AI對算力需求遠超以往:ChatGPT類語言大模型底層是2017年出現的Transformer架構,該架構相比傳統的 CNN/RNN為基礎的AI模型,參數量達到數千億,對算力消耗巨大,對算力硬件有大量需求。隨著對商業數據和大數據處理要求算力的不 斷提高,GPU的通用計算能力正在越來越廣泛地被應用與數據中心和國家超算中心的建設。 智能汽車:智能汽車方興未艾,自動駕駛和智慧座艙是智能汽車發展的主要方向,均需大量使用GPU。游戲:游戲業務是GPU應用的傳統領域,對游戲畫面進行3D渲染,英偉達的游戲業務穩中有進。

3.2AIChatGPTAI大模型加速對大算力的需求

ChatGPT 模型引發市場關注,對話類AI效果超大眾預期,大模型需要更大的算力。 202211月人工智能實驗室 OpenAI 推出了一款AI對話系統—ChatGPTChatGPT模型從 GPT-3.5 系列中的一個模型微調而成,并在 Azure AI 超級計算基礎設施上進行訓練,能夠進行有邏輯的對話、撰寫代碼、撰寫劇本、糾正錯誤、拒絕不正當的請求等,效果超越大 眾預期。這標志著對話類人工智能可以在大范圍、細節問題上給出較合理準確的答案,并根據上下文形成一定像人類一樣有邏輯且有創 造力的回答。 ChatGPT的優化主要來自模型的增大,以及因此帶來的算力增加。GPTGPT-2GPT-3(當前開放的版本為GPT-3.5)的參數量從1.17 億增加到1750億,預訓練數據量從5GB增加到45TB,其中GPT-3訓練單次的成本就高達460萬美元。

依據部署位置劃分,AI芯片可以細分為終端芯片和云端芯片,云端芯片市場空間越為終端芯片的2-3倍。云端芯片:云端芯片應用于云端服務器,可以進一步細分為推理芯片和訓練芯片。根據甲子光年數據,2018年中國云端芯片市場約46.1 億元,該機構預計2023年增長至384.6億元。 終端芯片:應用于嵌入式、移動終端、智能制造、智能家居等領域的AI芯片,終端芯片需要低功耗和更高的能效比,但是對算力的需求 也相對較低,主要應用與AI推理。根據甲子光年數據,2018年中國終端芯片市場約15億元,該機構預計2023年增長至173億元。

AI芯片總市場232億元,其中云端芯片市場空間更大,預計終端芯片將隨著AI在多行業落地將進一步放量。甲子光年預測,中國AI芯片市場規模將從2021232億元增長至2023年的500億元左右,對應中國云端芯片市場的復合增長率為52.8%; 終端芯片市場規模相對較小,但由于人工智能在汽車、安防、智能家居等行業滲透,屆時市場規模增長率達到62.2%

汽車智能化浪潮下汽車GPU市場前景廣闊自動駕駛

汽車智能化浪潮下,自動駕駛和智能座艙是最具有發展前景的兩個方向,GPU應用于二者的域控制器 n GPU兩大功能助力自動駕駛。智能汽車主流的域控制器采用SoCMCU結合的方案,SoC(片上系統) 由GPUCPUAI引擎、DPU等組成。GPU在自動駕駛中的 作用表現在圖形處理和并行計算,ADAS 平臺可以利用 GPU 的并行計算能力實時分析來自激光雷達、雷達和紅外攝像頭的傳感器數據。 蓋世汽車預計到2025年中國自動駕駛域控制器出貨量達到432萬臺。自動駕駛域控制器與SoC之比在1:11:4之間,市場份額較高的SoC通常搭載一片GPU

3.3、汽車智能化浪潮下汽車GPU市場前景廣闊智能座艙

GPU虛擬化技術助力智能座艙一芯多屏化發展。智能座艙芯片主要為SoC(片上系統),SoCGPUCPUAI引擎、DPU等組成。 智能座艙向著一芯多屏的形態發展,這對芯片并行計算的要求不斷提高,GPU硬件虛擬化技術在智能座艙中有著無可替代的優勢。在智 能座艙屏幕、儀表盤、車載與各系統中均需要使用GPU。 蓋世汽車預計2025年中國智能座艙域控制器出貨量達到528萬臺。智能座艙一臺域控制器內置一個SoC,位于汽車的中央顯示屏內,一個SoC通常搭載一片GPU

游戲市場是傳統意義上GPU最關鍵的市場。隨著千禧一代游戲需求的進一步提升,全球游戲玩家數量穩增,相應地擴展了游戲GPU市場規模。Newzoo Expert預計2020-2025年全 球游戲玩家人數復合年增率為4.2%。 游戲GPU的主要分類。根據現行市場上的主要產品可劃分為四類:1)游戲機、2PC端主機游戲、3)控制臺、4VR&AR

PC游戲市場主體 Ø PC指單機電腦、個人電腦。PC端游戲是通過計算機進行相關操作,實現人機交互的游戲方式。根據Jon Peddie Research統計,2021Q4全球PC GPU出貨量(包括集成和獨立顯卡)高達11000萬片。受到俄烏沖突、天然氣供應等 沖擊性全球事件影響,2022Q1Q2,全球PC GPU出貨量略有下降。GPUPC配售比。配售比指GPUPC主機的整體采用率,由于PC正常運行必須要求硬件上同時具備CPUGPU,因此每臺PC至少需要一張集成顯卡或獨 立顯卡,此外,根據需求可再增購獨立顯卡。根據JPR統計,全球GPUPC配售比在2022Q1達到了129%

 

(本文僅供參考,不代表我們的任何投資建議。如需使用相關信息,請參閱報告原文。)

 

 

 

 

服務熱線:400-610-7333 | 郵箱:service@gpos.cn | 電話:8610-82564561/71 | 傳真:8610-82564561-8025 | 京ICP備18017976號 | 京公網安備 11010802036102號 Copyright ? 2005-2025 Beijing Golden Point Outsourcing Service Co., Ltd. All Rights Reserved. | 北京金支點技術服務有限公司保留所有權利。