ICC訊 美國(guó)時(shí)間2026年1月5日下午2點(diǎn)16分(太平洋標(biāo)準(zhǔn)時(shí)間),在消費(fèi)電子展上,英偉達(dá)公司首席執(zhí)行官Jensen Huang正式發(fā)布了該公司新的Rubin計(jì)算架構(gòu),他將其描述為人工智能硬件的最新成果。該新架構(gòu)目前已投入生產(chǎn),并預(yù)計(jì)在今年下半年進(jìn)一步擴(kuò)大產(chǎn)能。
Jensen Huang告訴與會(huì)者:“Vera Rubin旨在應(yīng)對(duì)我們面臨的一個(gè)根本性挑戰(zhàn):人工智能所需的計(jì)算量正在飛速增長(zhǎng)。今天,我可以告訴大家,Vera Rubin已進(jìn)入全面生產(chǎn)階段?!? Rubin架構(gòu)最初于2024年公布,是英偉達(dá) relentless 硬件開(kāi)發(fā)周期的最新成果,這一周期已使英偉達(dá)轉(zhuǎn)型為全球市值最高的公司。Rubin架構(gòu)將取代Blackwell架構(gòu),而后者此前又取代了Hopper和Lovelace架構(gòu)。
廣泛的行業(yè)采用
Rubin芯片已計(jì)劃被幾乎所有主要云服務(wù)提供商使用,其中包括英偉達(dá)與Anthropic、OpenAI和亞馬遜網(wǎng)絡(luò)服務(wù)的高調(diào)合作。Rubin系統(tǒng)也將用于HPE的Blue Lion超級(jí)計(jì)算機(jī)以及勞倫斯伯克利國(guó)家實(shí)驗(yàn)室即將建成的Doudna超級(jí)計(jì)算機(jī)。
架構(gòu)組成與技術(shù)創(chuàng)新
該架構(gòu)以天文學(xué)家Vera Florence Cooper Rubin的名字命名,由六個(gè)獨(dú)立的芯片組成,設(shè)計(jì)為協(xié)同使用。Rubin GPU處于核心地位,但該架構(gòu)也通過(guò)分別對(duì)Bluefield和NVLink系統(tǒng)的新改進(jìn),解決了存儲(chǔ)和互連方面日益增長(zhǎng)的瓶頸。該架構(gòu)還包括一個(gè)全新的Vera CPU,專為智能體推理設(shè)計(jì)。
在解釋新存儲(chǔ)系統(tǒng)的優(yōu)勢(shì)時(shí),英偉達(dá)人工智能基礎(chǔ)設(shè)施解決方案高級(jí)總監(jiān)Dion Harris指出了現(xiàn)代AI系統(tǒng)對(duì)緩存相關(guān)內(nèi)存日益增長(zhǎng)的需求。Harris在電話會(huì)議上對(duì)記者表示:“當(dāng)你開(kāi)始啟用新型工作流,如智能體AI或長(zhǎng)期任務(wù)時(shí),這會(huì)給你的KV緩存帶來(lái)很大壓力和需求?!彼傅氖茿I模型用于壓縮輸入內(nèi)容的一種內(nèi)存系統(tǒng)?!耙虼?,我們引入了一個(gè)新的存儲(chǔ)層級(jí),它外部連接到計(jì)算設(shè)備,這使你能夠更高效地?cái)U(kuò)展存儲(chǔ)池?!?
顯著的性能飛躍
正如預(yù)期的那樣,新架構(gòu)在速度和能效方面也代表了顯著的進(jìn)步。根據(jù)英偉達(dá)的測(cè)試,在模型訓(xùn)練任務(wù)上,Rubin架構(gòu)的運(yùn)行速度將比前代Blackwell架構(gòu)快3.5倍,在推理任務(wù)上快5倍,最高可達(dá)50 petaflops。新平臺(tái)還將支持每瓦特高出8倍的推理計(jì)算能力。
發(fā)布的行業(yè)背景
Rubin新功能的發(fā)布正值人工智能基礎(chǔ)設(shè)施建設(shè)的激烈競(jìng)爭(zhēng)之際。在這場(chǎng)競(jìng)爭(zhēng)中,AI實(shí)驗(yàn)室和云服務(wù)提供商都在爭(zhēng)搶英偉達(dá)芯片以及為其供電所需的設(shè)施。在2025年10月的財(cái)報(bào)電話會(huì)議上,Jensen Huang估計(jì),未來(lái)五年內(nèi)將有3萬(wàn)億至4萬(wàn)億美元投入到AI基礎(chǔ)設(shè)施上。