Alibaba-backed Moonshot releases new Kimi AI model that beats ChatGPT, Claude in coding — and it costs less

CNBC
2025.07.14 07:30
portai
I'm PortAI, I can summarize articles.

阿里巴巴支持的初創公司 Moonshot 推出了其 Kimi K2 模型,這是一款低成本、開源的 AI 語言模型,在編碼能力上超越了 OpenAI 的 GPT-4.1 和 Anthropic 的 Claude Opus 4。Kimi K2 免費提供,僅對每百萬個輸入令牌收取 15 美分,對每百萬個輸出令牌收取 2.50 美元,價格顯著低於競爭對手。初步評價積極,儘管也注意到了一些幻覺問題。這一發布使 Moonshot 在全球 AI 市場中成為強有力的競爭者,尤其是在投資者尋求美國科技替代品的背景下

2025 年 6 月 19 日 MWC 上海科技展上的人工智能標誌。

彭博社 | 彭博社 | Getty Images

北京——最新的中國生成式人工智能模型正在挑戰 OpenAI 的 ChatGPT,提供編碼能力——價格更低。

阿里巴巴支持的初創公司 Moonshot 在週五晚上發佈了其 Kimi K2 模型:一個低成本、開源的大型語言模型——這兩個因素支撐了中國 DeepSeek 在 1 月份的行業顛覆。開源技術提供免費源代碼訪問,這種做法在美國科技巨頭中鮮有采用,除了 Meta 和 Google 在某種程度上。

巧合的是,OpenAI 首席執行官山姆·阿爾特曼在週六早些時候宣佈,由於安全問題,其首個開源模型將再次無限期推遲。OpenAI 沒有立即回應 CNBC 對 Kimi K2 的評論請求。

Kimi K2 的一個優勢在於為應用程序編寫計算機代碼,這是企業看到潛力以減少或替代員工的生成式人工智能領域。OpenAI 的美國競爭對手 Anthropic 在 5 月底發佈的 Claude Opus 4 模型中專注於編碼。

在社交媒體平台 X 和 GitHub 上的發佈公告中,Moonshot 聲稱 Kimi K2 在兩個基準測試中超過了 Claude Opus 4,並且在多個行業指標上整體表現優於 OpenAI 專注於編碼的 GPT-4.1 模型。

“毫無疑問 [Kimi K2 是] 一個具有全球競爭力的模型,而且是開源的,” Counterpoint 的人工智能首席分析師魏孫在週一的電子郵件中表示。

更便宜的選擇

“此外,它的令牌成本更低,使其對大規模或預算敏感的部署具有吸引力,” 她説。

與 ChatGPT 或 Claude 不同,新的 K2 模型通過 Kimi 的應用程序和瀏覽器界面免費提供,而後者需要為其最新的人工智能模型支付月費訂閲。

根據其網站,Kimi 每百萬輸入令牌僅收取 15 美分,每百萬輸出令牌收取 2.50 美元。令牌是衡量人工智能模型處理數據的一種方式。

相比之下,Claude Opus 4 對輸入的收費是每百萬令牌 15 美元,輸出則是每百萬令牌 75 美元,費用是其輸入的 100 倍。而對於每百萬令牌,GPT-4.1 的輸入收費為 2 美元,輸出收費為 8 美元。

Moonshot AI 在 GitHub 上表示,開發者可以隨意使用 K2,唯一的要求是如果商業產品或服務的月活躍用户超過 1 億,或月收入達到 2000 萬美元,則必須在用户界面上顯示 “Kimi K2”。

火熱的人工智能市場

K2 在英語和中文社交媒體上的初步評價大多是積極的,儘管有一些關於幻覺的報告,這是生成式人工智能中普遍存在的問題,模型會編造信息。

儘管如此,K2 是 “自 Claude 3.5 Sonnet 以來,我覺得可以放心在生產中使用的第一個模型,” 提供設計 AI 工具的初創公司 MagicPath 的創始人皮耶特羅·希拉諾在 X 上的一篇帖子中表示。

Moonshot 已經開源了一些之前的人工智能模型。該公司的聊天機器人在去年初迅速流行,成為中國的 ChatGPT 替代品,而後者在中國並未正式提供。但字節跳動和騰訊的類似聊天機器人隨後擠滿了市場,而科技巨頭百度則用人工智能工具重新改造了其核心搜索引擎。

Kimi 的最新人工智能發佈正值投資者關注中國在全球人工智能競爭中對美國科技的替代品。

儘管對 DeepSeek 的興奮情緒依然存在,但這傢俬人公司尚未宣佈對其 R1 和 V3 模型的重大升級。同時,早在今年初出現的另一家 DeepSeek 類型的初創公司 Manus AI 已將其總部遷至新加坡。

在美國,OpenAI 也尚未透露 GPT-5 的消息。

Counterpoint 的孫表示,GPT-5 的開發可能佔用了工程資源,阻礙了 OpenAI 在其開源模型上的進展,並補充説,發佈一個強大的開源模型而不削弱專有模型的競爭優勢是具有挑戰性的。

Grok 4 競爭者

Kimi K2 並不是該公司最近發佈的唯一模型。Moonshot 上個月推出了 Kimi 研究模型,並聲稱其在谷歌的 Gemini Deep Research 的 26.9 分上達到了匹配,並在一個名為 “人類最後的考試” 的基準測試中超過了 OpenAI 的版本。

Kimi 研究模型甚至在上週埃隆·馬斯克的 xAI 發佈 Grok 4 時被提及——後者在 “人類最後的考試” 基準測試中獨自得分 25.4,但在允許使用多種人工智能工具和網絡搜索時得分達到了 44.4。

“Kimi-Researcher 代表了代理人工智能的範式轉變,” 紐約大學法學院的兼職教授温斯頓·馬錶示。他提到人工智能能夠同時自主做出多個決策以完成複雜任務的能力。

“它不僅僅是生成流暢的響應,而是展示了專家級的自主推理——這種複雜的認知工作在大型語言模型中以前是缺失的,” 馬説。他還是《數字戰爭:如何中國的科技力量塑造人工智能、區塊鏈和網絡空間的未來》的作者。

——CNBC 的維多利亞·葉對此報告做出了貢獻。