ICC訊 2026年1月26日,微軟正式發(fā)布其最新自研AI芯片Maia 200。該公司將這款芯片描述為專為擴(kuò)展AI推理規(guī)模而設(shè)計(jì)的“硅基主力”(Silicon workhorse)。此舉是科技巨頭減少對英偉達(dá)依賴趨勢的一部分,旨在優(yōu)化日益重要的AI推理成本。
性能大幅提升,專為推理優(yōu)化
Maia 200是微軟繼2023年推出Maia 100后的第二代產(chǎn)品。微軟表示,該芯片在技術(shù)上經(jīng)過專門配備,能夠以更快的速度和更高的效率運(yùn)行強(qiáng)大的AI模型。與主要專注于訓(xùn)練任務(wù)的上一代不同,Maia 200是微軟首個(gè)“專門為AI推理優(yōu)化的硅芯片及系統(tǒng)平臺”,這意味著其設(shè)計(jì)聚焦于每美元所能提供的計(jì)算Token數(shù)以及每瓦電力的性能效率。
具體而言,Maia 200擁有超過1000億個(gè)晶體管,可提供超過10 PetaFlops的4位精度計(jì)算能力和約5 PetaFlops的8位精度性能,相比前代有大幅提升。微軟云與AI執(zhí)行副總裁Scott Guthrie在一篇博客中寫道,Maia 200能夠提供“比我們當(dāng)前最新一代硬件高出30%的每美元性能”。微軟稱,在實(shí)際應(yīng)用中,一個(gè)Maia 200節(jié)點(diǎn)可以輕松運(yùn)行當(dāng)今最大的模型,并為未來更龐大的模型預(yù)留充足空間。
關(guān)鍵技術(shù)特性與競爭優(yōu)勢
新芯片的關(guān)鍵特性包括一個(gè)強(qiáng)大的內(nèi)存子系統(tǒng)、一個(gè)用于跨集群和內(nèi)存子系統(tǒng)通信的片上網(wǎng)絡(luò),以及一個(gè)基于優(yōu)化的AI傳輸層(ATL)并支持標(biāo)準(zhǔn)以太網(wǎng)的以太網(wǎng)擴(kuò)展互連系統(tǒng)。Gartner副總裁分析師Chirag Dekate指出,Maia的內(nèi)存容量大于微軟同行提供的芯片。充足的內(nèi)存意味著微軟能夠“運(yùn)行那些目前本質(zhì)上受內(nèi)存帶寬和容量限制的思維與推理工作負(fù)載”。
在競爭格局方面,微軟在其新聞稿中指出,Maia的FP4性能是亞馬遜第三代Trainium芯片的3倍,F(xiàn)P8性能也高于谷歌的第七代TPU。微軟正憑借Maia與這些替代方案展開競爭。分析認(rèn)為,隨著推理工作負(fù)載的增加,運(yùn)營成本對于尋求運(yùn)行AI的公司而言正成為日益重要的因素,尤其是對Azure用戶。J. Gold Associates創(chuàng)始人Jack Gold表示,微軟創(chuàng)造這款芯片,旨在為其AI推理工作負(fù)載建立一個(gè)比使用通用GPU更低的成本結(jié)構(gòu),本質(zhì)上是通過直接定制芯片而非從英偉達(dá)或AMD購買,去掉了中間環(huán)節(jié)。
應(yīng)用部署與行業(yè)潛力
微軟表示,Maia已經(jīng)在為其超級智能團(tuán)隊(duì)的AI模型提供支持,并一直支撐著Copilot聊天機(jī)器人的運(yùn)營。目前,微軟已在其美國中部Azure數(shù)據(jù)中心區(qū)域部署了Maia 200,并計(jì)劃接下來在其美國西部-3區(qū)域啟用。不過,初期芯片似乎主要用于內(nèi)部用例。
微軟已發(fā)布了Maia軟件開發(fā)套件(SDK),邀請包括開發(fā)者、學(xué)者和前沿AI實(shí)驗(yàn)室在內(nèi)的各方在其工作負(fù)載中使用。這意味著企業(yè)最終將能夠在芯片上運(yùn)行自身工作負(fù)載,但該功能可能會逐步推出。預(yù)計(jì)Maia將首先向一批精選的企業(yè)客戶提供,然后才會全面開放。
分析師特別提到了Maia 200對電信行業(yè)的潛在影響。其基于以太網(wǎng)的互連系統(tǒng)對于希望提供增值服務(wù)、擺脫“笨管道”數(shù)據(jù)搬運(yùn)困境的電信運(yùn)營商來說可能是個(gè)好消息。Chirag Dekate認(rèn)為,運(yùn)營商有機(jī)會與微軟進(jìn)行戰(zhàn)略對話,探討在其設(shè)施中托管Maia實(shí)例或由Maia驅(qū)動的數(shù)據(jù)中心的可能性。這將使他們能夠以更高的能源和成本效率,提供新的、性能更強(qiáng)的智能體AI能力。
成本效益與未來展望
Dekate預(yù)計(jì),Maia 200推出的初步影響將體現(xiàn)在使用微軟Copilot的企業(yè)和電信運(yùn)營商獲得更好的結(jié)果上。隨著Maia 200最終可用于企業(yè)工作負(fù)載,客戶將能夠利用存儲在微軟Azure中的數(shù)據(jù)運(yùn)行更復(fù)雜的任務(wù),以更優(yōu)的成本跨一系列模型運(yùn)行更復(fù)雜、更可靠的智能體工作流。
然而,微軟將如何利用其節(jié)省的成本仍有待觀察:是降低客戶成本,還是將其轉(zhuǎn)化為Azure實(shí)例更高的利潤率。Dekate同意這一點(diǎn),他表示:“它不僅高效,而且成本結(jié)構(gòu)很可能具有很好的互補(bǔ)性?,F(xiàn)在,這將取決于微軟來決定和定義其定價(jià)模型……但從理論上講,能力是存在的。”
微軟此次發(fā)布Maia 200,彰顯了其通過自研硬件深入AI基礎(chǔ)設(shè)施核心的決心,旨在為未來激烈的AI競爭夯實(shí)底層算力基礎(chǔ)。