Moor Threads: Domestic GPU WanCard Cluster is Here

攜全棧 AI 產品和萬卡集羣解決方案首次亮相 WAIC 2024。

本文作者：張逸凡

編輯：申思琦

來源：硬 AI

7 月 4 日至 7 日，2024 世界人工智能大會（WAIC）在上海舉行，本屆 WAIC 除了 AI 大模型外，還有一個亮點來自硬件。

國產 GPU 廠商摩爾線程以"全棧 AI 為美好世界加速"為主題，攜全棧 AI 產品和萬卡集羣解決方案首次亮相 WAIC，展示了包括計算加速卡、服務器、超融合一體機、萬卡集羣方案和 AIGC 應用在內的摩爾線程全棧 AI 產品，以及攜手眾多行業合作伙伴聯合展示基於誇娥智算集羣的豐富行業大模型與應用方案。

一、全棧 AI 產品線首次出展

成立僅三年半，摩爾線程已經建立了從芯片、加速卡、服務器、集羣到軟件的全棧 AI 智算產品線。

其中全功能 GPU 芯片更是採用先進 MUSA 架構，具備集成 AI 計算加速、圖形渲染、視頻編解碼、物理仿真和科學計算等四大功能。

本次展會上，公司展出了以下重磅產品：

大模型智算加速卡 MTT S4000：專為大模型打造，單卡支持 48GB 顯存；
AI 大模型訓推一體機 MCCX D800：雙路 8 卡 GPU 服務器；
AI 超融合一體機 KUAE FUSION：靈活部署的推理、訓練、微調一體化解決方案；
誇娥（KUAE）萬卡智算集羣：可擴展至萬卡規模的大模型訓練平台；

二、軟硬同時發力，從基礎算力到 AIGC 應用

摩爾線程的展台分為三大板塊 ——

誇娥平台：萬卡 AI 算力底座；
AIGC：加速釋放創作生產力；
AI+ 產業數智化升級；

1）誇娥平台：萬卡 AI 算力底座

“誇娥平台” 是一個覆蓋 AI 全棧的解決方案，作為 AI 算力底座，展示了強大的性能和廣泛的兼容性。包含誇娥集羣管理平台、誇娥模型服務平台和誇娥大模型推理平台三大核心產品：

誇娥集羣管理平台：實現智算中心運維自動化；
誇娥模型服務平台：提供大模型生命週期管理；
誇娥大模型推理平台：支持主流推理框架；

誇娥集羣管理平台 (KUAE Platform) 實現了多數據中心、多集羣算力資源的靈活管理，集成了多維度運維監控、告警和日誌系統，助力智算中心實現運維自動化。

誇娥模型服務平台 (KUAE ModelStudio) 覆蓋了大模型預訓練、微調和推理全流程，支持所有主流開源大模型，並通過 MUSIFY 代碼移植工具實現了對 CUDA 應用生態的良好兼容。

誇娥大模型推理平台基於高效的 MT Transformer 引擎，支持業內主流 vLLM 推理框架和 MUSA Serving 自研推理框架，實現了對長文本推理、動態連續 Batch、MoE 等熱點技術的支持。

2）AIGC：加速釋放創作生產力

在 AIGC 創意工具方面，摩爾線程也展示了內容創作、圖像生成等產品。

"摩筆馬良"是一個 AIGC 內容創作平台，集成了自研大語言模型和先進的圖像生成技術。該平台以誇娥智算集羣為算力底座，成功部署了 MUSAChat 自研大語言模型，能夠補足 Prompt 工程，潤色和翻譯用户輸入文本。該平台可靈活調用 SDXL 和 SD1.5 兩代模型能力，生成細節豐富的圖像。

"創意人像"功能能夠快速生成個性化肖像。基於 SDXL 模型並結合多種 IP-Adapter、ControlNet 技術，用户只需上傳一張照片並描述目標風格，即可在 1 分鐘內獲得個性化人像。

"摩筆天書"則提供了全自動的繪本生成解決方案。通過輸入標題和簡要故事大綱，一鍵生成完整故事、繪本圖片、旁白、字幕和背景音樂。

此外，摩爾線程還開發了 MT AIReality 渲染平台，旨在革新影視、動畫等領域的資產製作流程，用更低的成本完成高質量的實時渲染。值得一提的是，摩爾線程還參與了 Open Sora Plan，利用其誇娥智算集羣為 AI 視頻生成提供強大的算力支持，旨在集結開源社區力量完成對 Sora 文生視頻的復現。

3）AI+ 產業數智化升級

在產業應用方面，摩爾線程展示了交通、金融、安防等多個行業落地方案。

與上海人工智能實驗室合作的"書生·風烏"大模型實現了全球 10 天以上天氣的 10 公里級建模與預報，並在 24 小時內完成從 CUDA 到 MUSA 的快速生態遷移。

在智慧交通領域，摩爾線程與佳都科技合作的全息路口解決方案以三維高精地圖為底座，結合佳都自研知行大模型，實現了實時交通信息傳遞與智能化處理。

在金融服務方面，摩爾線程為 Reportify 提供的高效、穩定的大模型在線服務，經受住了高流量業務衝擊，大幅提升了數據處理效率。

此外，摩爾線程還展示了在智慧安防、AI 輔助決策等領域的應用。公司的全功能 GPU 在人工智能、視頻編解碼等方面的多元算力支持，滿足了智慧安防系統對多種模態數據輸入的需求。與中科聞歌合作的雅意大模型則在政策解讀、輿情感知、政務治理、金融分析等領域展現出低延遲、高精度的特性。