Alibaba Tongyi Qianwen tops the global open-source model rankings

智通財經
2025.04.02 06:33
portai
I'm PortAI, I can summarize articles.

阿里的通義千問近日發佈的全模態大模型 Qwen2.5-Omni 在全球 AI 開源社區 Hugging Face 的榜單中登頂,成為全球開源模型的第一名。這是中國科技企業首次包攬榜單前三名,顯示出杭州在 AI 創新領域的領導地位。Qwen2.5-Omni 能夠處理多種輸入並生成自然語音,且其小尺寸使得廣泛應用成為可能。緊隨其後的是 DeepSeek 的 V3-0324 和羣核的 SpatialLM-Llama-1B。

智通財經 APP 獲悉,4 月 2 日,全球最大的 AI 開源社區 Hugging Face 更新了大模型榜單,阿里 (09988) 通義千問近期開源的端到端全模態大模型 Qwen2.5-Omni 登上總榜榜首,DeepSeek-V3-0324 和羣核的 SpatialLM-Llama-1B 緊隨其後。這是中國科技企業首次包攬全球開源模型榜單前三席位,杭州作為 AI 創新策源地地位凸顯。

此次榮登榜首的端到端全模態大模型 Qwen2.5-Omni 可同時處理文本、圖像、音頻和視頻等多種輸入,並實時生成文本與自然語音合成輸出。相較於動輒數千億參數的閉源大模型,Qwen2.5-Omni 以 7B 的小尺寸讓全模態大模型在產業上的廣泛應用成為可能。即便在手機上,也能輕鬆部署和應用 Qwen2.5-Omni 模型。

而 SpatialLM 是羣核科技自主研發的一款空間理解模型,該模型僅通過一段視頻即可生成物理正確的 3D 場景佈局。不同於傳統大語言模型,SpatialLM 突破了對物理世界幾何與空間關係的理解侷限,將在機器類人的空間認知和解析能力上發揮重大作用。

另外,DeepSeek 發佈的 V3-0324 是 V3 的一次小版本更新,雖然官方稱這只是 “小版本升級”,但實測能力接近 V3.5 版本,尤其在複雜邏輯和多模態理解上表現突出。