Hyper Racetrack | Meta Platforms' Self-developed Inference Chip: Deployment to be Completed This Year

華爾街見聞
2024.02.03 12:43
portai
I'm PortAI, I can summarize articles.

作者:周源/華爾街見聞

在 Meta 創下美股史上單日最高漲幅紀錄的同時,該公司一份內部文件曝光:Meta 計劃今年在該公司的數據中心部署新版自研定製芯片(ASIC),以支持其 AI 業務的進一步發展。

在過去的 2023 年,這家公司在推動 AI 和元宇宙的願景方面,“取得了很大進展”,Meta 首席執行官馬克·扎克伯格(Mark Zuckerberg)在其財報會議上説。

Meta 發言人證實了這項計劃並稱,其自研芯片將與 Meta 購買的現成的英偉達 GPU 協同以增強 AI 算力,共同夯實該公司的 AI 基礎設施能力。

這位發言人表示,Meta 自研芯片將在 2024 年投產,以此降低 AI 加速卡採購成本,減少對英偉達的依賴。

公開信息顯示,Meta 的這款 ASIC 在內部被稱為 “Artemis”,主要性能集中在推理領域,技術開發基於 2023 年宣佈的第二代內部芯片產品線。

北美時間 2 月 1 日,Meta 公佈了截至 2023 年 12 月 31 日的 2023 財年第四財季業績:各項財務數據大幅超出此前市場預期;同時,Meta 對今年一季度的經營業績也做出了超出預期的樂觀預估,故而 Meta 股價在 2 月 2 日(北京時間)錄得美股史上最大單日漲幅紀錄。

自研推理 ASIC 以降低成本

從 2022 年 12 月 22 日 OpenAI 發佈 ChatGPT-3.5 以來,推進 GenAI(生成式人工智能:Genetic Artificial Intelligence)技術應用所需的 AI 芯片成本、基礎設施能力和能耗,成為科技公司資金的 “虹吸器”,在一定程度上抵消了圍繞這項技術的顯性或隱性收益。

故而,包括微軟、亞馬孫和谷歌,英特爾、AMD 和高通等等在內的美國科技巨頭,無不加入自研 AI 芯片的大軍,Meta 也是其中的一員。

英偉達 H100 的價格已經飆升至 2.5 萬-3 萬美元,這意味着 ChatGPT 單次查詢的成本將提高至約 0.04 美元。即使只維持 ChatGPT 的基本運作,每年也需要約 160 億美元成本。

Meta 的 “Artemis” 芯片和其前代產品一樣,也只能執行 “推理” 負載工作,模型被要求使用它們的算法做出排名判斷,並對用户提示做出回應。這家曾於 2023 年分享其首代 Meta 訓練和推理加速器(MTIA)項目的相關細節,但此後這個項目再未有新進展披露。

Meta 公司發言人在一份聲明中表示,“我們認為內部開發的 AI 加速器與商用 GPU 具有高度互補性,可以在 Meta 特定工作負載上提供性能和效率的最佳組合。”

據馬克·扎克伯格在今年 1 月發佈的視頻信息,Meta 計劃在 2024 年底前擁有大約 35 萬顆來自英偉達的旗艦 AI 芯片 H100,這是英偉達研發的當前全球最受歡迎的用於人工智能工作負載的服務器 GPU。扎克伯格強調,與自研版全新 AI 芯片和其他潛在供應商的 AI 芯片累加,Meta 將累積等效於 60 萬顆 H100 AI GPU 的算力。

在視頻中,扎克伯格透露了 Meta 人工智能計劃的更新路線圖:Meta 將圍繞即將推出的 Llama 3 構建全新的 Meta AI 路線圖,目前正在推進 Llama 3 的 AI 訓練。Llama 3 將與 Google 最近發佈的 Gemini 模型和 OpenAI 的 GPT-4、以及即將推出的 GPT-5 模型競爭。

關於 Llama 3 的最早傳聞出現在 2023 年 8 月,但 Meta 從未正面承認這項全新的 GenAI 產品的技術迭代,直到今年 1 月扎克伯格發佈的這則視頻。

到了今年 1 月 30 日,扎克伯格在一條推特中直接提到了 Llama 3。行業認為 Meta 透露 2024 年部署自研的 “Artemis” AI 推理芯片與 Llama 3 有關。

扎克伯格暗示,Llama 3 很可能是 Meta 的第一個支持多媒體和語音輸入的多模式模型。Llama 2 則只是一個聊天機器人,用户只能在其中提出問題並編寫故事。

目前,Meta 仍未正面透露 Llama 3 的發佈時間,或許這與 Artemis 何時真正能部署在該公司的數據中心有關。

公開消息顯示,Meta 正在加速建設數據中心(IDC),以專注於 GPU 計算。Meta 更新其 IDC 的最新努力主要集中在構建擁有數千個加速器的大型集羣;IDC 的核心網絡以網格形式組織,加速器之間的帶寬為每秒 1 TB。Meta 在全球擁有 21 個數據中心。

但很顯然,這還不夠。要實現扎克伯格的最終目標,還需要更多的 GPU。

“很明顯,下一代服務需要構建全面的通用智能、構建最好的 AI 助手、為企業創造者以及更多要在 AI 各個領域取得進步——從推理到規劃到編碼到記憶和其他認知能力。” 扎克伯格説,“人們還需要新的人工智能設備,這將 AI 和元宇宙結合在一起,因為隨着時間的推移,我認為我們很多人會在一天中頻繁地與 AI 交談。”

VR/AR 部門單擊營收創紀錄

Meta 引人注目的最新表現,是在 2 月 1 日。

這一天,Meta 公佈了截至 2023 年 12 月 31 日的 2023 財年第四財季業績。

財報顯示,Meta 在 2023 年第四季度實現營收 401.1 億美元,較去年同期增長 25%,高於分析師預期的 390.1 億美元,這也是 Meta 自 2021 年三季度以來最大的營收增幅;淨利潤同比增長 201% 至 140.17 億美元,高於市場預期的 128.90 億美元;攤薄後每股收益同比增長 203% 至 5.33 美元,高於市場預期的 4.95 美元。

2023 年全年,Meta 實現營收 1349.02 億美元,同比增長 16%;淨利潤同比增長 69% 至 390.98 億美元。

不僅如此,Meta 預計在今年一季度,公司營收將達到 345 億美元至 370 億美元之間,高於分析師預期的 336.4 億美元。

比這更奪人眼球的是 Meta 宣佈增加 500 億美元股票回購,將在今年三月進行公司史上首次發放股息紅利,包括 A 類普通股和 B 類普通股,每股派發 0.50 美元現金。

受多項利好消息刺激,2 月 1 日盤中,Meta 市值增加了約 2000 億美元,為美股歷史上首次。

至收盤,Meta 錄得 20.32% 的巨大漲幅,超越蘋果和亞馬遜此前創出的最佳單日表現紀錄。蘋果市值曾在 2022 年 11 月 10 日增加 1909 億美元,亞馬遜於同年 2 月 4 日增加 1908 億美元市值,英偉達市值在 2023 年 5 月 25 日增加了 1841 億美元。

值得一提的是 Meta 的 VR/AR 部門 Reality Labs,負責 Quest 頭顯、Ray-Ban 智能眼鏡、Horizon 平台以及 AR 眼鏡及其神經腕帶輸入設備的研發。

據 Meta 最新財報顯示,Reality Labs 的季度收入為 10.7 億美元,也創出了一項新紀錄。Meta 首席財務官 Susan Li 稱,這一創紀錄的收入 “由 Quest 3 在假期期間的銷售推動”。Quest 3 於 2023 年 10 月 10 日推出,Meta 第四季度營收包含 10 月、11 月和 12 月。

蘋果在今年 1 月 19 日開始預訂 Vision Pro,至 2 月 1 日,據稱已售出超過 20 萬台(3499 美元/台,據 2 月 2 日美國蘋果門店的用户稱,當日有人接受每台 2000 美元的加價),這給蘋果帶來了約 7 億美元的收入。

Meta 財報顯示,由於 2023 年第四季度 Reality Labs 的成本達到有史以來最高的 57.2 億美元,故而導致該部門季度虧損了 46.5 億美元。

但市場對此顯得很寬容,認為像 Quest 這樣的 XR 頭顯仍然是一項相對早期的技術,遠未成熟,因此將這項虧損認為是早期投資的必須。目前,Meta 還沒推出 AR 眼鏡,但 Reality Labs 超過 50% 的支出都集中在 AR 眼鏡的研發上。

據 Valve 公佈的 2024 年 1 月 Steam 平台的 VR 設備使用數據顯示,1 月 VR 頭顯使用量增加 0.4%。其中,佔比排名第一的是 Quest 2,1 月使用份額為 40.64%;Valve Index HMD 排名第二,使用份額為 15%;Quest 3 排第三,佔整體使用份額的 14.05%。