
Alibaba's Upgraded Qwen3 Outperforms OpenAI, DeepSeek

阿里巴巴集團推出了其 Qwen3 大型語言模型的升級版,在關鍵基準測試中超越了 OpenAI 和 DeepSeek。新模型 Qwen3-235B-A22B-Instruct-2507-FP8 在遵循指令和編碼方面顯示出顯著的改進,輸入容量增加至 256,000 個標記。此外,阿里巴巴的 30 億參數 Qwen 模型將為惠普在中國的智能助手提供支持。英偉達首席執行官在最近訪問中國時讚揚了 Qwen 系列,強調其先進的能力。阿里巴巴的股票今年上漲超過 42%,表現優於紐約證券交易所綜合指數
阿里巴巴集團 BABA 推出了其第三代 Qwen3 大型語言模型(LLMs)的升級版本,增強了其在數學和編碼方面的 AI 能力,以在關鍵基準測試中超越 OpenAI 和 DeepSeek 的頂級模型。
新的開源模型 Qwen3-235B-A22B-Instruct-2507-FP8 在指令跟隨、邏輯推理、編碼、科學和工具使用方面顯著提升,正如《南華早報》週二在 HuggingFace 和阿里巴巴的 ModelScope 平台上的更新中所指出的。
雖然升級後的 Qwen 模型目前以非思考模式運行,直接輸出而不顯示推理步驟,但它現在支持最多 256,000 個標記的輸入。這是一個八倍的增長,使得模型能夠在單次對話中處理更長的文本序列。
另請閲讀:阿里巴巴和華為主導中國日益增長的雲市場
除了核心 LLM 的進展,阿里巴巴還宣佈其 30 億參數的 Qwen 模型將為 HP 在中國的 “智能助手小微會” 提供支持。這一整合旨在幫助用户更高效地撰寫文檔和總結會議。
公司發佈的性能數據表明,Qwen3-Coder 在關鍵編碼基準測試中超越了國內競爭對手,如 DeepSeek 和 Moonshot AI 的 K2。阿里巴巴還表示,該模型在某些能力上與美國頂級產品,包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude 相媲美。
熱門投資機會
在最近一次訪問中國時,Nvidia NVDA 首席執行官 黃仁勳 稱讚 Qwen 系列,以及 DeepSeek 和 Moonshot 的 Kimi 模型,認為它們是全球最先進的開放推理 AI 系統之一,強調了中國在全球 AI 競賽中的快速進展。
黃仁勳在美國批准該公司 H20 GPU 的出口許可證申請後不久訪問中國,這些 GPU 旨在符合美國出口法規。儘管美國機構尚未最終確定文件,但黃仁勳表示,政府向 Nvidia 保證將授予許可證。
阿里巴巴的股票今年以來大幅上漲,年初至今上漲超過 42%,表現超過了紐約證券交易所綜合指數的 8% 的漲幅。
價格動態: 截至週三最後檢查,BABA 股價在盤前交易中上漲 2.15%,至 123.31 美元。
- 阿里巴巴因交付價格戰損失數十億,市值蒸發 1000 億美元
照片由 Mamun_Sheikh 提供,來源於 Shutterstock
