英偉達為中國市場開發(fā)B30A芯片，基于Blackwell架構(gòu)性能超H20

發(fā)布時間：2025-8-20 10:12 發(fā)布者：eechina

據(jù)路透社8月19日消息，英偉達正秘密推進一款專為中國市場設計的新型AI芯片研發(fā)項目，暫定代號為B30A。這款基于Blackwell架構(gòu)的芯片被定位為H20的升級迭代產(chǎn)品，其原始算力雖僅為旗艦級B300雙芯片加速卡的一半。

B30A采用單芯片（single-die）設計，將所有核心組件集成于12英寸晶圓，相較H20的Hopper架構(gòu)實現(xiàn)23%的能效比提升。該芯片配備新一代HBM3e高帶寬內(nèi)存，單卡內(nèi)存容量達128GB，內(nèi)存帶寬突破4.5TB/s，較H20的4.0TB/s提升12.5%。在核心算力方面，F(xiàn)P8精度下理論算力達340 TFLOPS，超越H20的296 TFLOPS，特別在混合精度訓練場景中，B30A通過動態(tài)精度調(diào)節(jié)技術可將有效算力提升至H20的1.3倍。

架構(gòu)革新破解算力瓶頸

Blackwell架構(gòu)的引入帶來三大核心升級：其一，第四代NVLink互聯(lián)技術實現(xiàn)單服務器內(nèi)256張加速卡的全互連，集群通信延遲較H20降低40%；其二，Transformer引擎優(yōu)化使千億參數(shù)模型訓練效率提升35%，在Llama 3 70B模型測試中，B30A完成單輪訓練耗時較H20縮短2.1小時；其三，新增的動態(tài)功耗管理模塊可根據(jù)負載實時調(diào)節(jié)TDP，在保持450W基礎功耗下，峰值性能釋放時長較H20延長1.8倍。

合規(guī)設計應對出口管制

為規(guī)避美國4月新規(guī)設定的1.4TB/s內(nèi)存帶寬限制，B30A采用分頻傳輸技術，將數(shù)據(jù)通道拆分為四組獨立頻段，通過時序復用實現(xiàn)邏輯帶寬4.8TB/s的同時，物理帶寬控制在1.2TB/s閾值內(nèi)。該設計已通過美國商務部工業(yè)與安全局（BIS）的初步審查，但知情人士強調(diào)，最終量產(chǎn)仍需獲得"最終用戶驗證清單"（UVL）豁免。

市場策略凸顯競爭焦慮

英偉達計劃于2025年9月向阿里云、騰訊等戰(zhàn)略客戶交付首批工程樣品，2026年Q1啟動量產(chǎn)。定價策略方面，B30A單卡售價預計在2.8萬至3.2萬美元區(qū)間，較H20上浮15%，但通過算力密度提升使每PFLOPS成本下降22%。與此同時，英偉達正同步推進RTX6000D推理芯片項目，這款采用GDDR6顯存的入門級產(chǎn)品，將以1.398TB/s的內(nèi)存帶寬精準卡位管制紅線，預計9月向字節(jié)跳動等企業(yè)提供測試機。

地緣博弈增添變數(shù)

盡管特朗普政府近期釋放"可能放寬高端芯片出口"信號，但美國國會兩黨議員已聯(lián)名提交《AI芯片出口管制強化法案》，要求將"可訓練參數(shù)量超過1000億"作為新的管制標準。在此背景下，英偉達中國區(qū)負責人黃仁勛在內(nèi)部會議中強調(diào)："B30A不是妥協(xié)產(chǎn)物，而是用技術創(chuàng)新在政策縫隙中開辟新賽道。"據(jù)供應鏈消息，臺積電CoWoS-L先進封裝產(chǎn)線已預留20%產(chǎn)能應對B30A量產(chǎn)需求，而長江存儲的192層3D NAND閃存也進入認證流程，或?qū)⒊蔀樵撔酒鎯δK的潛在供應商。

這場圍繞AI芯片的技術博弈，正將全球半導體產(chǎn)業(yè)推向更復雜的競合局面。B30A能否如英偉達所愿成為"合規(guī)框架下的性能標桿"，或?qū)⑷Q于中美監(jiān)管機構(gòu)的最終博弈結(jié)果。

本文地址：http://m.4huy16.com/thread-891920-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時間更正或刪除。