|
據(jù)路透社8月19日消息,英偉達正秘密推進一款專為中國市場設計的新型AI芯片研發(fā)項目,暫定代號為B30A。這款基于Blackwell架構(gòu)的芯片被定位為H20的升級迭代產(chǎn)品,其原始算力雖僅為旗艦級B300雙芯片加速卡的一半。 B30A采用單芯片(single-die)設計,將所有核心組件集成于12英寸晶圓,相較H20的Hopper架構(gòu)實現(xiàn)23%的能效比提升。該芯片配備新一代HBM3e高帶寬內(nèi)存,單卡內(nèi)存容量達128GB,內(nèi)存帶寬突破4.5TB/s,較H20的4.0TB/s提升12.5%。在核心算力方面,F(xiàn)P8精度下理論算力達340 TFLOPS,超越H20的296 TFLOPS,特別在混合精度訓練場景中,B30A通過動態(tài)精度調(diào)節(jié)技術可將有效算力提升至H20的1.3倍。 架構(gòu)革新破解算力瓶頸 Blackwell架構(gòu)的引入帶來三大核心升級:其一,第四代NVLink互聯(lián)技術實現(xiàn)單服務器內(nèi)256張加速卡的全互連,集群通信延遲較H20降低40%;其二,Transformer引擎優(yōu)化使千億參數(shù)模型訓練效率提升35%,在Llama 3 70B模型測試中,B30A完成單輪訓練耗時較H20縮短2.1小時;其三,新增的動態(tài)功耗管理模塊可根據(jù)負載實時調(diào)節(jié)TDP,在保持450W基礎功耗下,峰值性能釋放時長較H20延長1.8倍。 合規(guī)設計應對出口管制 為規(guī)避美國4月新規(guī)設定的1.4TB/s內(nèi)存帶寬限制,B30A采用分頻傳輸技術,將數(shù)據(jù)通道拆分為四組獨立頻段,通過時序復用實現(xiàn)邏輯帶寬4.8TB/s的同時,物理帶寬控制在1.2TB/s閾值內(nèi)。該設計已通過美國商務部工業(yè)與安全局(BIS)的初步審查,但知情人士強調(diào),最終量產(chǎn)仍需獲得"最終用戶驗證清單"(UVL)豁免。 市場策略凸顯競爭焦慮 英偉達計劃于2025年9月向阿里云、騰訊等戰(zhàn)略客戶交付首批工程樣品,2026年Q1啟動量產(chǎn)。定價策略方面,B30A單卡售價預計在2.8萬至3.2萬美元區(qū)間,較H20上浮15%,但通過算力密度提升使每PFLOPS成本下降22%。與此同時,英偉達正同步推進RTX6000D推理芯片項目,這款采用GDDR6顯存的入門級產(chǎn)品,將以1.398TB/s的內(nèi)存帶寬精準卡位管制紅線,預計9月向字節(jié)跳動等企業(yè)提供測試機。 地緣博弈增添變數(shù) 盡管特朗普政府近期釋放"可能放寬高端芯片出口"信號,但美國國會兩黨議員已聯(lián)名提交《AI芯片出口管制強化法案》,要求將"可訓練參數(shù)量超過1000億"作為新的管制標準。在此背景下,英偉達中國區(qū)負責人黃仁勛在內(nèi)部會議中強調(diào):"B30A不是妥協(xié)產(chǎn)物,而是用技術創(chuàng)新在政策縫隙中開辟新賽道。"據(jù)供應鏈消息,臺積電CoWoS-L先進封裝產(chǎn)線已預留20%產(chǎn)能應對B30A量產(chǎn)需求,而長江存儲的192層3D NAND閃存也進入認證流程,或?qū)⒊蔀樵撔酒鎯δK的潛在供應商。 這場圍繞AI芯片的技術博弈,正將全球半導體產(chǎn)業(yè)推向更復雜的競合局面。B30A能否如英偉達所愿成為"合規(guī)框架下的性能標桿",或?qū)⑷Q于中美監(jiān)管機構(gòu)的最終博弈結(jié)果。 |