Meta 發力 AI:官宣訓練和推理芯片項目,首款定製 AI 芯片超低功耗

華爾街見聞
2023.05.18 19:06
portai
I'm PortAI, I can summarize articles.

Meta 將這款 AI 芯片稱為 MTIA,它的功耗僅 25 瓦,號稱比競品芯片更有效處理中低複雜度的 AI 模型,目前重點放在 Meta 應用的推理、不是訓練。Meta 未透露配置 MTIA 的時間表,稱 MTIA 是加快 AI 訓練和推理的芯片 “家族” 成員之一。

繼利用人工智能(AI)提升廣告效果後,Meta 又在芯片上發力。

美東時間 5 月 18 日 Meta 披露了旗下數據中心項目支持 AI 工作的細節,提到已經打造一款定製芯片,簡稱 MTIA,用於加快生成式 AI 模型的訓練。這是 Meta 首次推出 AI 定製芯片。Meta 稱,MTIA 是加快 AI 訓練和推理工作負載的芯片 “家族” 的一分子。

MTIA 全稱為 Meta 訓練和推理加速器。所謂推理是指運行經過訓練的模型。MTIA 是一種 ASIC,也就是將不同電路集成在一塊板上的芯片,可以將它進行編程,執行一項或多項任務。

Meta 介紹,MTIA 採用開源芯片架構 RISC-V,它的功耗僅有 25 瓦,遠低於英偉達等主流芯片廠商的產品功耗。

Meta 稱,2020 年設計了第一代 MTIA 芯片,採用 7 納米工藝,那是同名 MTIA 項目的部分工作。打造第一代芯片的目的是提高推薦模型的效率,那些模型服務於廣告和其他新聞推送內容。一代 MTIA 可以將內部 128MB 的內存擴展到高達 128GB。在 Meta 設計的基準測試中,它處理了低等和中等複雜度的 AI 模型,效率比 GPU 高。

Meta 的軟件工程師 Joel Cohurn 介紹新芯片時稱,Meta 最初用圖形處理單元(GPU)執行推理任務,發現 GPU 不太適合這種工作。用 GPU 固然可以大幅優化軟件,但對真實模型的效率很低,現實配置時難度大、成本高。所以 Meta 需要 MTIA。

Meta 承認,MTIA 芯片在處理高複雜度 AI 模型時遇到了問題,但指出,它比競品芯片能更有效地處理中低複雜度的模型。

Meta 表示,芯片在內存和網絡領域的工作還未完成,隨着 AI 模型發展,這些工作會出現瓶頸。目前,MTIA 的重點放在 Meta 應用家族的推理,而不是訓練。不過 Meta 強調,MTIA“大大” 提高了單位瓦特的推薦負載運行效率,讓公司能運行加強版的、更尖端的 AI 工作負載。

Meta 本週四並未披露配置新芯片的時間表,也未説明具體有什麼計劃開發可能訓練模型的芯片。

Meta 同時介紹,計劃針對以 AI 為核心的網絡和冷卻系統,重新設計其數據中心,今年內,首個相關數據中心的設施將破土動工。Meta 的員工演示時稱,新設計的成本將降低 31%,而且建造速度是公司目前數據中心的兩倍。

Meta 還介紹了旗下的一種 AI 驅動系統,它可幫助 Meta 的工程師編寫電腦代碼。Meta 的 AI 助力代碼工具名為 CodeCompose,目前沒有對外公開。公司團隊內部用它獲取 Python 和其他語言的代碼建議。

今年 ChatGPT 掀起 AI 的熱潮後,Meta 正在努力追趕其他硅谷巨頭加速開發 AI 功能的腳步。

2 月 Meta 推出針對研究社區的大型語言模型 LLaMA ,不同於 ChatGPT 和必應這類聊天機器人,它是開源的 “研究工具”,可以在非商業許可下提供給政府、社區和學術界的研究人員和實體工作者。當月有報道稱,Meta 將 AI 率先用於廣告功能,推出名為 Advantage+ 的廣告產品,針對不同的用户,讓 AI 根據算法自動生成廣告。

上月初傳出 Meta年底前推出 AI 廣告工具的消息。Meta 首席技術官 Andrew Bosworth 當時説,Meta 將推出生成廣告圖像的 AI 工具,幫助公司針對不同的受眾製作不同的圖像。

上月末 Meta 公佈了優於預期的一季度業績,並承諾要對火爆的 AI 領域加大押注。Meta 的 CEO 扎克伯格評價一季度業績時稱,AI 推動 App 和業務取得良好成果,還在業績電話會上説,對 AI 和元宇宙要兩手抓。

在 Meta 本週四官宣之前,其他科技巨頭已有定製 AI 芯片的動作。

谷歌用簡稱 TPU 的處理器訓練 PaLM-2 等旗下大型生成式 AI 系統。亞馬遜為雲服務 AWS 的客户提供訓練和推理的專屬芯片。上月媒體稱,微軟在與 AMD 合作開發名為 Athena 的自有 AI 芯片。