NVIDIA 推出 Nemotron 3 系列開放模型

訊石光通訊網(wǎng) 發(fā)布時間:2025/12/16 9:38:06 編者:iccsz

摘要：Nemotron 3 系列開放模型包含 Nano、Super 和 Ultra 三種規(guī)模，具有極高的效率和領先的精度，適用于代理式 AI 應用開發(fā)。 Nemotron 3 Nano 的吞吐量比 Nemotron 2 Nano 高 4 倍，并通過突破性的異構混合專家 (Hybrid Mixture-of-Experts) 架構，在大規(guī)模多智能體系統(tǒng)中實現(xiàn)了領先的每秒生成 token 數(shù)。 Nemotron 通過先進的強化學習技術以及大規(guī)模并行多環(huán)境后訓練，實現(xiàn)了卓越的準確率。 NVIDIA 率先推出整套前沿的開放模型、訓練數(shù)據(jù)集及強化學習環(huán)境與庫，助力構建高精度、高效的專業(yè) AI 智能體。

ICC訊 NVIDIA 于 12 月 15 日宣布推出 NVIDIA Nemotron? 3 系列開放模型、數(shù)據(jù)和庫，為各個行業(yè)透明、高效的專業(yè)代理式 AI 開發(fā)提供助力。

Nemotron 3 模型提供 Nano、Super 和 Ultra 三種規(guī)模，采用突破性的異構潛在混合專家 (MoE) 架構，幫助開發(fā)者大規(guī)模開發(fā)并部署可靠的多智能體系統(tǒng)。

隨著企業(yè)從單模型對話機器人轉向協(xié)作式多智能體 AI 系統(tǒng)，開發(fā)者面臨著日益嚴峻的挑戰(zhàn)，包括通信開銷、上下文漂移和高推理成本等。此外，開發(fā)者需要模型具備透明度，才能信任其用于自動化復雜工作流。Nemotron 3 直面這些挑戰(zhàn)，為用戶提供開發(fā)專業(yè)化代理式 AI 所需的性能與開放性。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“開放創(chuàng)新是 AI 進步的基礎。通過 Nemotron，我們將先進 AI 轉化成開放平臺，為開發(fā)者提供構建大規(guī)模代理式系統(tǒng)所需的透明度與效率?！?

NVIDIA Nemotron 為 NVIDIA 更廣泛的主權 AI 工作提供支持。從歐洲到韓國，企業(yè)組織紛紛采用開放、透明、高效的模型開發(fā)符合自身數(shù)據(jù)、法規(guī)與價值觀的 AI 系統(tǒng)。

Nemotron 系列模型的早期用戶包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Perplexity、ServiceNow、西門子、新思科技和 Zoom。他們正將 Nemotron 系列模型集成到制造、網(wǎng)絡安全、軟件開發(fā)、媒體、通信等行業(yè)的 AI 工作流中。

ServiceNow 董事長兼首席執(zhí)行官 Bill McDermott 表示：“NVIDIA 與 ServiceNow 多年來一直致力于塑造 AI 的未來，而最好的部分尚未到來。今天，我們在幫助各行業(yè)領導者加速推進代理式 AI 戰(zhàn)略方面邁出了重要的一步。通過結合 ServiceNow 的智能工作流自動化與 NVIDIA Nemotron 3，我們將以出色的效率、速度與精度繼續(xù)定義行業(yè)標準。”

隨著多智能體 AI 系統(tǒng)的擴展，開發(fā)者越來越依賴專有模型來實現(xiàn)前沿推理，同時使用更加高效、可定制的開放模型降低成本。在單一工作流中于前沿級模型與 Nemotron 之間進行任務路由，既能賦予智能體強大的智能，同時還可以優(yōu)化 token 經(jīng)濟效益。

Perplexity 首席執(zhí)行官 Aravind Srinivas 表示：“Perplexity 的構建理念是當精準 AI 融入先進工具時(例如 AI 助手)，人類的好奇心將被放大。通過我們的智能體路由器，可以將工作負載定向到領先的精細調優(yōu)開放模型，如 Nemotron 3 Ultra，或在任務能夠從其獨特能力中受益時，利用領先的專有模型，以此確保我們的 AI 助手能夠以卓越的速度、效率和規(guī)模運行?！?

Nemotron 3 開放模型使初創(chuàng)公司能夠更快開發(fā)和迭代 AI 智能體，并加快從原型到企業(yè)級部署的創(chuàng)新進程。General Catalyst 和 Mayfield 旗下的投資組合公司正在探索如何使用 Nemotron 3 開發(fā)支持人機協(xié)作的 AI 隊友。

Mayfield 管理合伙人 Navin Chaddha 表示：“NVIDIA 的開放模型堆棧與 NVIDIA 初創(chuàng)加速計劃為初創(chuàng)公司提供了各類模型、工具及經(jīng)濟高效的基礎設施，助力其開展試驗、實現(xiàn)差異化發(fā)展并快速擴展規(guī)模。Nemotron 3 可以讓創(chuàng)始人在構建代理式 AI 應用和 AI 隊友方面取得先機，并幫助他們利用 NVIDIA 龐大的用戶基礎?！?

Nemotron 3 以高效和精準重塑多智能體 AI

Nemotron 3 系列 MoE 模型包含三種規(guī)模：

Nemotron 3 Nano：是一款具備 300 億參數(shù)的小型模型，每次運行最多激活 30 億參數(shù)，適用于針對性、高效的任務。

Nemotron 3 Super：是一款具備約 1,000 億參數(shù)的高精度推理模型，每個 token最多激活 100 億參數(shù)，適用于多智能體應用。

Nemotron 3 Ultra：是一款具備約 5,000 億參數(shù)的大型推理引擎，每個 token 最多激活 500 億參數(shù)，適用于復雜的 AI 應用。

Nemotron 3 Nano 已正式上線，是計算成本效益極高的模型，其針對軟件調試、內容摘要、AI 助手工作流及信息檢索等任務進行了優(yōu)化，同時保持了較低的推理成本。該模型采用獨特的異構 MoE 架構，以實現(xiàn)效率與可擴展性的提升。

這一設計使其 token 吞吐量較 Nemotron 2 Nano 至高提升 4 倍，并減少了多達 60% 的推理 token 生成量，大大降低了推理成本。具備 100 萬 token 的上下文處理能力，Nemotron 3 Nano 具有更強的記憶能力，在處理長時間多步驟任務時能更精準地關聯(lián)信息。

獨立 AI 基準測試機構 Artificial Analysis 評定該模型為同等規(guī)模模型中兼具極高開放性和效率及卓越精度的模型。

在需要多智能體協(xié)作完成低延遲復雜任務的應用中，Nemotron 3 Super 表現(xiàn)出色。Nemotron 3 Ultra 則作為高級推理引擎，服務于需要深度研究和策略規(guī)劃的 AI 工作流。

Nemotron 3 Super 與 Ultra 采用基于 NVIDIA Blackwell 架構的超高效 4 位 NVFP4 訓練格式，可顯著降低顯存需求并加速訓練進程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎設施上進行訓練，不會因更高精度格式而犧牲準確性。

借助 Nemotron 3 系列模型，開發(fā)者可根據(jù)特定工作負載選擇適配的開放模型，在數(shù)十至數(shù)百個智能體間靈活擴展，同時在復雜工作流中獲得更快速、精準的長時推理能力。

用于 AI 智能體定制的全新開放工具與數(shù)據(jù)

NVIDIA 還發(fā)布了面向專業(yè) AI 智能體開發(fā)者的訓練數(shù)據(jù)集與前沿強化學習庫集合。

3 萬億 token 規(guī)模的全新 Nemotron 預訓練、后訓練及強化學習數(shù)據(jù)集，為開發(fā)高性能特定領域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset 則提供真實場景的遙測數(shù)據(jù)，幫助團隊評估并提升復雜智能體系統(tǒng)的安全性。

為加速開發(fā)進程，NVIDIA 發(fā)布了 NeMo Gym 與 NeMo RL 開源庫，為 Nemotron 模型提供訓練環(huán)境及后訓練基礎，同時還推出用于驗證模型安全性和性能的 NeMo Evaluator。所有工具及數(shù)據(jù)集現(xiàn)已上線 GitHub 和 Hugging Face 平臺。

Nemotron 3 已獲得 LM Studio 、llama.cpp、SGLang 和 vLLM 支持。此外，Prime Intellect 與 Unsloth 正將 NeMo Gym 的即用型訓練環(huán)境直接集成至其工作流，使團隊能夠更加快速、便捷地獲得強大的強化學習訓練能力。

開始使用 NVIDIA 開放模型

Nemotron 3 Nano 現(xiàn)已上線 Hugging Face 平臺，并通過 Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI 等推理服務商提供。

Nemotron 還上線了多個企業(yè)級 AI 與數(shù)據(jù)基礎設施平臺，包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外，Nemotron 3 Nano 將通過 Amazon Bedrock(無服務器模式)在亞馬遜云科技 (AWS) 平臺上提供給使用公有云的客戶，并且也即將支持 Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。

Nemotron 3 Nano 同時以 NVIDIA NIM 形式提供，可在 NVIDIA 加速基礎設施上進行安全、可擴展的部署，具有極高的隱私性與可控性。

Nemotron 3 Super 和 Ultra 預計將于 2026 年上半年推出。

關于 NVIDIA

NVIDIA (NASDAQ: NVDA) 是 AI 和加速計算領域的全球領導者。

內容來自：NVIDIA
本文地址：http://m.n2software.net//Site/CN/News/2025/12/16/20251216013928832554.htm 轉載請保留文章出處
關鍵字:
文章標題:NVIDIA 推出 Nemotron 3 系列開放模型

1、凡本網(wǎng)注明“來源：訊石光通訊網(wǎng)”及標有原創(chuàng)的所有作品，版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉載、摘編及鏡像，違者必究。對于經(jīng)過授權可以轉載我方內容的單位，也必須保持轉載文章、圖像、音視頻的完整性，并完整標注作者信息和本站來源。
2、免責聲明，凡本網(wǎng)注明“來源：XXX（非訊石光通訊網(wǎng)）”的作品，均為轉載自其它媒體，轉載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責。因可能存在第三方轉載無法確定原網(wǎng)地址，若作品內容、版權爭議和其它問題，請聯(lián)系本網(wǎng)，將第一時間刪除。
聯(lián)系方式：訊石光通訊網(wǎng)新聞中心　電話：0755-82960080-168 Right

NVIDIA 推出 Nemotron 3 系列開放模型

相關新聞