阿里开源新版 Qwen3 模型 霸榜文本表征
阿里巴巴開源了 Qwen3 系列新模型,包括 Qwen3-Embedding 和 Qwen3-Reranker,專注於文本表徵、檢索與排序任務。Qwen3-Embedding 在多語言文本表徵基準測試中表現優異,8B 參數模型以 70.58 分排名第一,超越谷歌 Gemini-Embedding。該系列支持 119 種語言,提供靈活的模型架構和定製化特性,顯著提升搜索結果的相關性。
智通財經 APP 獲悉,今日凌晨,阿里巴巴 (09988) 開源了兩款 Qwen3 系列新模型,Qwen3-Embedding 和 Qwen3-Reranker。這兩個模型是專為文本表徵、檢索與排序任務設計,基於 Qwen3 基礎模型訓練,充分繼承了 Qwen3 在多語言文本理解方面的優勢,支持 119 種語言。根據測試數據顯示,在多語言文本表徵基準測試中,Qwen3 Embedding 的性能非常出色。其中,8B 參數以 70.58 的高分排名第一,超越了眾多商業 API 服務,例如,谷歌的 Gemini-Embedding。
卓越的泛化性: Qwen3-Embedding 系列在多個下游任務評估中達到行業領先水平。其中,8B 參數規模的 Embedding 模型在 MTEB 多語言 Leaderboard 榜單中位列第一(截至 2025 年 6 月 6 日,得分 70.58),性能超越眾多商業 API 服務。此外,該系列的排序模型在各類文本檢索場景中表現出色,顯著提升了搜索結果的相關性。
靈活的模型架構: Qwen3-Embedding 系列提供從 0.6B 到 8B 參數規模的 3 種模型配置,以滿足不同場景下的性能與效率需求。開發者可以靈活組合表徵與排序模塊,實現功能擴展。
此外,模型支持以下定製化特性:
1) 表徵維度自定義:允許用户根據實際需求調整表徵維度,有效降低應用成本;
2) 指令適配優化:支持用户自定義指令模板,以提升特定任務、語言或場景下的性能表現。
全面的多語言支持: Qwen3-Embedding 系列支持超過 100 種語言,涵蓋主流自然語言及多種編程語言。該系列模型具備強大的多語言、跨語言及代碼檢索能力,能夠有效應對多語言場景下的數據處理需求。

在多項基準測試中,Qwen3-Embedding 系列在文本表徵和排序任務中展現了卓越的性能。


目前,該系列模型已在 Hugging Face、ModelScope 和 GitHub 平台開源,用户也可以直接使用阿里雲百鍊平台提供的最新的文本向量模型服務。