ICC訊 OpenAI 昨日(2 月 5 日)發(fā)布公告,宣布推出 GPT-5.3-Codex,宣稱這是其迄今最強(qiáng)的 AI 智能體編程模型。
附上相關(guān)基準(zhǔn)測(cè)試結(jié)果如下:
在 SWE-bench Pro(公開版)測(cè)試中,該模型得分 56.8%,超越了前代的 56.4%;
在 Terminal-Bench 2.0 測(cè)試中,其得分從前代的 64.0% 大幅躍升至 77.3%;
最為顯著的是在 OSWorld-Verified 智能體計(jì)算機(jī)操作基準(zhǔn)測(cè)試中,得分從 38.2% 飆升至 64.7%,表明其在復(fù)雜環(huán)境下的操作能力實(shí)現(xiàn)了質(zhì)的飛躍。
官方數(shù)據(jù)顯示,該模型不僅在多項(xiàng)編程基準(zhǔn)測(cè)試中創(chuàng)下新高,運(yùn)行速度也比前代 GPT-5.2-Codex 提升了 25%。
OpenAI 致力于將 GPT-5.3-Codex 打造為更優(yōu)秀的開發(fā)者協(xié)作工具。新模型支持用戶在任務(wù)執(zhí)行過程中進(jìn)行“引導(dǎo)與交互”,且不會(huì)導(dǎo)致上下文丟失。
在 Codex 應(yīng)用中,模型會(huì)高頻更新工作進(jìn)度,允許開發(fā)者實(shí)時(shí)提問、討論方案并修正方向。官方博文指出,Codex 正從單一的編程智能體演變?yōu)楦ㄓ玫挠?jì)算機(jī)協(xié)作者,大幅降低了構(gòu)建應(yīng)用的門檻。
GPT-5.3-Codex 目前已全面向 ChatGPT 付費(fèi)用戶開放,涵蓋 Plus、Team 及 Enterprise 等訂閱計(jì)劃。用戶可通過 Codex 應(yīng)用、命令行工具(CLI)、IDE 擴(kuò)展插件及網(wǎng)頁(yè)端立即訪問,API 版本也將在近期上線。
新聞來源:IT之家