據香港IDC新天域互聯了解,在群眾AI算力競爭日趨熱烈的布景下,谷歌云(Google Cloud)在最新一屆App Dev & Infrastructure峰會上發布重磅新品——新一代云霄超等盤算處事Hypercomputer登第六代TPU(張量解決器)Trillium,展現了其在AI基礎措施限制的宏愿。
算作現在浮點運算性能最強的TPU,Trillium的單一集群可提供高達91 exaflops的算力。與客歲發布的TPU v5e比較,新品在AI模子測驗性能上提高了4倍,推理隱約量提高3倍,單芯片峰值盤算性能更是提高了4.7倍。值得刺見識是,在性能大幅提高的同期,其動力破費卻減少了67%,體現了谷歌在綠色盤算方面的技巧松懈。
在本體性能測試中,Trillium在初始Gemma 2-27B、MaxText Default-32B和Llama2-70B等大模子時,性能較上一代TPU v5p提高卓絕4倍。從老本效益角度來看,Trillium比v5e跨越1.8倍,比v5p跨越2倍,展現出極具競爭力的性價比。
硬件升級方面,新品在高頻內存(HBM)容量和芯片間互連帶寬上齊終赫然翻倍提高。通過芯片互連技巧(ICI),單個高帶寬低延長Pod最多可推廣至256個芯片,并可通過一語氣數百個Pod釀成包含上萬顆芯片的超等盤算集群。合營谷歌13 Petabit/s的Jupiter數據中心匯集,可終了接近線性的性能推廣。
除了新一代TPU,谷歌云還推出了多項配套居品:搭載NVIDIA H200 Tensor Core GPU的A3 Ultra VM預覽版將于11月推出,其GPU間匯集帶寬和LLM推感性能較前代居品提高1倍;基于自研Arm架構Axion解決器的C4A VM處事也已上線,較傳統x86架構VM在性價比和能效方面分袂提高65%和60%。
在匯集措施方面,新上線的Jupiter光纖交換匯集提供400Gb/s的原生一語氣速率和13.1Pb/s的對分帶寬,據稱可解決地球上通盤視頻圖像。同期推出的AI/ML專用存儲處事Hyperdisk ML在數據傳輸速率上達到了1.2TB/s,超越競爭敵手近100倍。
跟著AI技巧快速發展,算力需求呈指數級增長。這次谷歌全面升級AI基礎措施,不僅展現了其在AI芯片限制的技巧實力,更預示著新一輪算力競爭的到來。在英偉達主導的AI芯片商場中開yun體育網,谷歌能否憑借新品掀開陣勢,值得商場執續格式。