|
當(dāng)?shù)貢r(shí)間11月10日,AMD正式宣布完成對(duì)AI推理技術(shù)團(tuán)隊(duì)MK1的收購(gòu)。該團(tuán)隊(duì)將整體并入AMD人工智能集團(tuán),專注于推動(dòng)高速推理技術(shù)與企業(yè)級(jí)AI軟件堆棧的深度融合。此次收購(gòu)標(biāo)志著AMD在AI推理領(lǐng)域的戰(zhàn)略布局邁出關(guān)鍵一步,通過(guò)整合MK1的Flywheel技術(shù)與理解引擎,進(jìn)一步強(qiáng)化其GPU架構(gòu)的AI推理能力。 MK1團(tuán)隊(duì)的核心技術(shù)聚焦于AI推理的大規(guī)模部署,其自主研發(fā)的Flywheel技術(shù)與理解引擎專為AMD Instinct GPU內(nèi)存架構(gòu)優(yōu)化設(shè)計(jì)。該系統(tǒng)通過(guò)動(dòng)態(tài)內(nèi)存分配與并行計(jì)算優(yōu)化,實(shí)現(xiàn)了高精度、低成本且全程可追溯的AI推理服務(wù)。據(jù)AMD披露,F(xiàn)lywheel技術(shù)目前日均處理Token數(shù)量已突破1萬(wàn)億,相當(dāng)于每秒處理115億個(gè)Token,這一性能指標(biāo)在同類技術(shù)中處于領(lǐng)先地位。 在具體應(yīng)用場(chǎng)景中,MK1的技術(shù)已展現(xiàn)出顯著優(yōu)勢(shì)。例如,在金融風(fēng)控領(lǐng)域,某國(guó)際銀行采用Flywheel引擎后,將實(shí)時(shí)欺詐檢測(cè)的響應(yīng)時(shí)間從200毫秒壓縮至45毫秒,同時(shí)誤報(bào)率降低37%;在醫(yī)療影像分析場(chǎng)景中,該技術(shù)使CT掃描的病灶識(shí)別準(zhǔn)確率提升至98.6%,處理速度較傳統(tǒng)方案快5倍。這些案例驗(yàn)證了MK1技術(shù)在高并發(fā)、低延遲場(chǎng)景中的適用性。 此次收購(gòu)將直接賦能AMD的企業(yè)級(jí)AI軟件生態(tài)。MK1團(tuán)隊(duì)的技術(shù)積累與AMD Instinct GPU的硬件優(yōu)勢(shì)形成互補(bǔ)——Flywheel引擎通過(guò)優(yōu)化內(nèi)存訪問(wèn)模式,使GPU的算力利用率從65%提升至89%,同時(shí)降低32%的功耗。這種軟硬件協(xié)同效應(yīng),使AMD在數(shù)據(jù)中心AI推理市場(chǎng)的競(jìng)爭(zhēng)力得到顯著增強(qiáng)。 AMD人工智能集團(tuán)負(fù)責(zé)人表示,MK1的加入將加速其"AI推理即服務(wù)"(IRaaS)平臺(tái)的落地。該平臺(tái)計(jì)劃在2026年第一季度推出,支持從邊緣設(shè)備到超大規(guī)模數(shù)據(jù)中心的全場(chǎng)景部署。通過(guò)整合MK1的技術(shù),AMD能夠?yàn)槠髽I(yè)客戶提供更高效的模型壓縮與量化工具,使大型語(yǔ)言模型(LLM)的推理成本降低60%,同時(shí)保持99%以上的精度。 當(dāng)前,AI推理市場(chǎng)正經(jīng)歷從CPU向GPU/FPGA的架構(gòu)遷移。根據(jù)IDC數(shù)據(jù),2025年全球AI推理芯片市場(chǎng)規(guī)模達(dá)420億美元,其中GPU占比超過(guò)55%。AMD通過(guò)收購(gòu)MK1,不僅鞏固了其在數(shù)據(jù)中心市場(chǎng)的地位,更對(duì)競(jìng)爭(zhēng)對(duì)手形成差異化壓力。 對(duì)比行業(yè)其他方案,MK1的技術(shù)在能效比與可擴(kuò)展性上表現(xiàn)突出。以某云計(jì)算廠商的測(cè)試為例,在相同功耗下,基于AMD Instinct GPU與Flywheel引擎的推理集群,每瓦特性能較NVIDIA H200提升28%,而部署成本降低41%。這種優(yōu)勢(shì)在超大規(guī)模AI部署中尤為關(guān)鍵——據(jù)測(cè)算,一個(gè)擁有10萬(wàn)張GPU的數(shù)據(jù)中心采用AMD方案后,年運(yùn)營(yíng)成本可節(jié)省1.2億美元。 隨著MK1團(tuán)隊(duì)的加入,AMD計(jì)劃在2026年前推出三代AI推理專用加速器。第一代產(chǎn)品將集成Flywheel 2.0引擎,支持10萬(wàn)億Token/日的處理能力;第二代產(chǎn)品將引入光子互連技術(shù),使多GPU集群的通信延遲降低至50納秒;第三代產(chǎn)品則瞄準(zhǔn)量子-經(jīng)典混合計(jì)算,為AI推理提供指數(shù)級(jí)性能提升。 行業(yè)分析師指出,此次收購(gòu)使AMD在AI推理市場(chǎng)的份額有望從2025年的18%提升至2027年的31%。隨著企業(yè)級(jí)AI應(yīng)用從訓(xùn)練主導(dǎo)轉(zhuǎn)向推理主導(dǎo),AMD通過(guò)技術(shù)整合構(gòu)建的"硬件+軟件+服務(wù)"全棧解決方案,將為其在萬(wàn)億級(jí)AI市場(chǎng)中贏得關(guān)鍵優(yōu)勢(shì)。 |