Alibaba's Upgraded Qwen3 Outperforms OpenAI, DeepSeek

阿里巴巴集團推出了其 Qwen3 大型語言模型的升級版，在關鍵基準測試中超越了 OpenAI 和 DeepSeek。新模型 Qwen3-235B-A22B-Instruct-2507-FP8 在遵循指令和編碼方面顯示出顯著的改進，輸入容量增加至 256,000 個標記。此外，阿里巴巴的 30 億參數 Qwen 模型將為惠普在中國的智能助手提供支持。英偉達首席執行官在最近訪問中國時讚揚了 Qwen 系列，強調其先進的能力。阿里巴巴的股票今年上漲超過 42%，表現優於紐約證券交易所綜合指數

阿里巴巴集團 BABA 推出了其第三代 Qwen3 大型語言模型（LLMs）的升級版本，增強了其在數學和編碼方面的 AI 能力，以在關鍵基準測試中超越 OpenAI 和 DeepSeek 的頂級模型。

新的開源模型 Qwen3-235B-A22B-Instruct-2507-FP8 在指令跟隨、邏輯推理、編碼、科學和工具使用方面顯著提升，正如《南華早報》週二在 HuggingFace 和阿里巴巴的 ModelScope 平台上的更新中所指出的。

雖然升級後的 Qwen 模型目前以非思考模式運行，直接輸出而不顯示推理步驟，但它現在支持最多 256,000 個標記的輸入。這是一個八倍的增長，使得模型能夠在單次對話中處理更長的文本序列。

另請閲讀：阿里巴巴和華為主導中國日益增長的雲市場

除了核心 LLM 的進展，阿里巴巴還宣佈其 30 億參數的 Qwen 模型將為 HP 在中國的 “智能助手小微會” 提供支持。這一整合旨在幫助用户更高效地撰寫文檔和總結會議。

公司發佈的性能數據表明，Qwen3-Coder 在關鍵編碼基準測試中超越了國內競爭對手，如 DeepSeek 和 Moonshot AI 的 K2。阿里巴巴還表示，該模型在某些能力上與美國頂級產品，包括 OpenAI 的 GPT-4 和 Anthropic 的 Claude 相媲美。

熱門投資機會

在最近一次訪問中國時，Nvidia NVDA 首席執行官 黃仁勳 稱讚 Qwen 系列，以及 DeepSeek 和 Moonshot 的 Kimi 模型，認為它們是全球最先進的開放推理 AI 系統之一，強調了中國在全球 AI 競賽中的快速進展。

黃仁勳在美國批准該公司 H20 GPU 的出口許可證申請後不久訪問中國，這些 GPU 旨在符合美國出口法規。儘管美國機構尚未最終確定文件，但黃仁勳表示，政府向 Nvidia 保證將授予許可證。

阿里巴巴的股票今年以來大幅上漲，年初至今上漲超過 42%，表現超過了紐約證券交易所綜合指數的 8% 的漲幅。

價格動態： 截至週三最後檢查，BABA 股價在盤前交易中上漲 2.15%，至 123.31 美元。

阿里巴巴因交付價格戰損失數十億，市值蒸發 1000 億美元

照片由 Mamun_Sheikh 提供，來源於 Shutterstock