英偉達AI芯片勁敵來(lái)了!AMD推出MI300X,可運行多達800億參數模型
憑借發(fā)布的新品,AMD正式向英偉達的AI芯片王者地位發(fā)起挑戰。
美東時(shí)間6月13日周二,AMD舉行了新品發(fā)布會(huì ),其中最重磅的新品當屬性用于訓練大模型的ADM最先進(jìn)GPU Instinct MI300。
(資料圖)
AMD CEO蘇姿豐介紹,生成式AI和大語(yǔ)言模型(LLM)需要電腦的算力和內存大幅提高。她預計,今年,數據中心AI 加速器的市場(chǎng)將達到300億美元左右,到2027 年將超過(guò)1500 億美元,復合年增長(cháng)率超過(guò) 50%。
蘇姿豐演示介紹,AMD的Instinct MI300A號稱(chēng)全球首款針對AI和高性能計算(HPC)的加速處理器(APU)加速器。在13個(gè)小芯片中遍布1460億個(gè)晶體管。
它采用CDNA 3 GPU架構和24個(gè)Zen 4 CPU內核,配置128GB的HBM3內存。相比前代MI250,MI300的性能提高八倍,效率提高五倍。AMD在發(fā)布會(huì )稍早介紹,新的Zen 4c內核比標準的Zen 4內核密度更高,比標準Zen 4的內核小35%,同時(shí)保持100%的軟件兼容性。
AMD推出一款GPU專(zhuān)用的MI300,即MI300X,該芯片是針對LLM的優(yōu)化版,擁有192GB的HBM3內存、5.2TB/秒的帶寬和 896GB/秒的Infinity Fabric 帶寬。AMD將1530億個(gè)晶體管集成在共12個(gè)5納米的小芯片中。
AMD稱(chēng),MI300X提供的HBM密度最高是英偉達AI芯片H100的2.4倍,其HBM帶寬最高是H100的1.6倍。這意味著(zhù),AMD的芯片可以運行比英偉達芯片更大的模型。
蘇姿豐介紹,MI300X可以支持400億個(gè)參數的Hugging Face AI 模型運行,并演示了讓這個(gè)LLM寫(xiě)一首關(guān)于舊金山的詩(shī)。這是全球首次在單個(gè)GPU上運行這么大的模型。單個(gè)MI300X可以運行一個(gè)參數多達800億的模型。
LLM需要的GPU更少,給開(kāi)發(fā)者帶來(lái)的直接好處就是,可以節約成本。
AMD還發(fā)布了AMD Instinct 平臺,它擁有八個(gè)MI300X,采用行業(yè)標準OCP設計,提供總計1.5TB 的HBM3 內存。
蘇姿豐稱(chēng),適用于CPU和GPU的版本MI300A現在就已出樣,MI300X和八個(gè)GPU的Instinct 平臺將在今年第三季度出樣,第四季度正式推出。
亞馬遜、微軟、Meta已經(jīng)或將要運用AMD新品
除了AI芯片,AMD此次發(fā)布會(huì )還介紹了第四代EPYC(霄龍)處理器,特別是在全球可用的云實(shí)例方面的進(jìn)展。
AMD第四代EPYC(霄龍)在云工作負載的性能是英特爾競品處理器的1.8倍,在企業(yè)工作負載中的處理速度是英特爾競品的1.9倍。
AMD稱(chēng),第四代EPYC(霄龍)啟用新的Zen 4c內核,比英特爾Xeon 8490H的效率高1.9倍。由于絕大多數AI在CPU上運行,AMD在CPU AI領(lǐng)域具有絕對的領(lǐng)先優(yōu)勢。
亞馬遜周二宣布,在用AWS Nitro和第四代EPYC 處理器打造新的實(shí)例。亞馬遜云的EC2 M7a實(shí)例現已提供預覽版,性能比M6a實(shí)例高50%。
AMD也將在內部工作中運用EC2 M7a實(shí)例,包括芯片設計的EDA軟件。AMD還宣布,今年7月,甲骨文將推出Genoa E5實(shí)例。
AMD發(fā)布的EPYC Bergamo處理器是業(yè)界首款x86原生CPU,有128個(gè)內核,每個(gè)插槽256個(gè)線(xiàn)程。這意味著(zhù)一個(gè)普通的2U 4 節點(diǎn)平臺將有 2048 個(gè)線(xiàn)程。
Bergamo比前代Milan的性能高2.5倍,現在就可以向AMD的云客戶(hù)發(fā)貨。
Meta的公司代表介紹,Meta在基礎設施中使用EPYC處理器。Meta也對基于A(yíng)MD的處理器設計開(kāi)源。Meta方面稱(chēng),計劃為其基礎設施使用云處理器Bergamo,還要將Bergamo用于其存儲平臺。
AMD同時(shí)推出本周二上市的CPU Genoa-X。它將增加超過(guò)1GB 的96核L3緩存。它共有四個(gè)SKU,16到 96 個(gè)內核。因為SP5插槽兼容,所以它可以與現有的EPYC 平臺一起使用。
微軟的公司代表和AMD一道展示了微軟云Azure HPC的性能,在EPYC處理器的幫助下,Azure四年內的性能提升四倍。
Azure宣布,搭載Genoa-X的HBv4和HX系列實(shí)例、以及新的HBv3實(shí)例全面上市。Azure還稱(chēng),性能最高可較市面基準提升5.7倍。
AMD此前通過(guò)收購Pensando獲得DPU技術(shù)。此次AMD稱(chēng),其P4 DPU架構是世界上最智能的DPU,它能減少數據中心的網(wǎng)絡(luò )開(kāi)銷(xiāo),并提高了服務(wù)器的可管理性。AMD的Pensando SmartNICs是這種新數據中心架構不可或缺的組成部分。
AMD還提到有自己的AI芯片軟件,名為ROCm。AMD總裁Victor Peng稱(chēng),在構建強大的軟件堆棧方面,AMD取得了真正的巨大進(jìn)步,ROCm軟件??膳c模型、庫、框架和工具的開(kāi)放生態(tài)系統配合使用。
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: