
為什麼説邊緣計算有望成就高通的 “算力夢”

國盛證券表示,當前市場普遍聚焦於雲端算力發展,忽視了邊緣算力在 AI 乃至社會數字化發展中的重要地位。高通有望憑藉其手機芯片,物聯網芯片、通信芯片三大能力,成為邊緣算力的 “英偉達”。
6 月 2 日,邊緣計算概念股持續活躍,美格智能強勢漲停。
此前高通公司高級副總裁表示,高通正在從一家通信公司過渡到一家邊緣計算公司。
國盛證券指出,與英偉達在計算能力相對應,高通在全球通信領域處於霸主地位,無論是從決定無線通信能力的基帶產品,亦或是決定手機性能的手機芯片,高通都擁有絕對的全球領先地位。而隨着 “算力” 成為 AI 時代的最寶貴資源,高通不滿足於 “通信” 能力的領先,而是希望依靠通信能力和終端設備佈局,從邊緣側進軍被英偉達覆蓋的算力領域。
國盛證券認為,隨着 AI 刺激下,算力加速走向 “泛在”,高通有望憑藉其手機芯片,物聯網芯片、通信芯片三大能力,成為邊緣算力的 “英偉達”。
國信證券還提到,目前具備運行優化模型能力的終端僅限頭部品牌旗艦手機,隨着 AI 大模型在邊緣端落地,有望推動新一輪換機潮。
邊緣算力優勢
邊緣算力,通常指部署在設備本地的算力或者離用户距離較近的數據中心中的算力,邊緣算力相較於雲端算力,擁有低成本、低時延、高隱私三大特性。
1)低成本:當前主流的邊緣算力平台主要採用高通主導下的 ARM 架構,相比於英偉達的複雜架構,ARM 架構在小算力時擁有極低的單位成本,是降低開發與用户成本的必然選擇。
2)低時延:邊緣算力一般搭載在本地,無需將數據發送至雲端並等待回傳的時間,可以滿足如自動駕駛,快速對話等對時延要求高的場景。
3)高隱私:邊緣算力依靠設備本身搭載的算力或在用户自有服務器上的算力進行推理,可以實現數據不出用户管轄範圍,對隱私的保護更好。
當下邊緣算力主要有兩種存在模式,一種是設備本身搭載的算力,這類算力通常依託邊緣處理芯片存在,邊緣處理芯片包括了手機終端上的驍龍與蘋果 M 平台,面向 IOT 設備的如高通 8155 芯片或者專為 AI 優化的 QCM8550 芯片。通常,大單品採用直採芯片 + 定製 PCB 的形式進行開發,而中小廠商與細分垂直領域往往採購模組來滿足算力需求。
第二種算力存在形式是邊緣資源池,通常由離用户較近的核心城市內的數據中心構成,或者由廠區,道路旁的小機櫃、算力盒子提供算力。
AI 生態中最重要的組成部分之一
國盛證券指出,當前市場普遍聚焦於雲端算力發展,忽視了邊緣算力在 AI 乃至社會數字化發展中的重要地位。隨着 AI 大模型應用逐漸滲透進入千行百業和各類垂直細分場景,單純的大規模計算中心提供的算力將不能滿足多樣化的 AI 運算需求,其認為邊緣算力具備不可或缺性:
第一,未來隨着計算芯片加速發展,單位算力成本中,電費與土地費用佔比將愈發提升,算力成本將取決於智算中心的地理位置,以我國舉例,未來算力成本較低的西部將是雲端算力主要部署地。因此,大算力與低時延需求將出現錯配。
第二,AI 模型推理 Token 費用較貴,如果需要成熟商用,邊緣預處理將是必須選項。通過邊緣部署的算力,將用户的多樣化需求進行本地的預處理,簡單的需求直接利用本地模型和算力推理,複雜需求通過邊緣算力預處理後,精簡成最少的 TOKEN 發送至雲端,從而能夠最低成本的實現應用功能,加速商業化。
最後,無論是對用户個人敏感數據進行推理,還是推理設計商業敏感數據,完全與雲端隔絕的邊緣算力,能為用户提供最好的數據安全保護。
國盛證券表示,在生成式 AI 爆發前,邊緣算力已經逐漸滲透進了部分商用場景,如手機雲遊戲、無人設備駕駛、自動視頻識別等。如今隨着 MLC-LLM,谷歌模型體系等軟件基建加速,特斯拉機器人為具身智能完成物理基建,在終端設備上推理生成式模型,甚至讓智能設備同物理世界自主交互的條件已經具備,未來隨着應用加速滲透、預處理模型需求爆發,以及邊緣小模型推理,智能設備物理交互需求爆發。
邊緣端落地有望推動新一輪換機潮
國信證券還提到,AI 部署本地化具有必要性,優勢包括更低的延遲、更小的帶寬、提高數據安全、保護數據隱私、高可靠性等。完整的大模型僅參數權重就佔滿一張 80G 的 GPU,但是通過量化、知識蒸餾、剪枝等優化,大模型可以在手機本地實現推理。
其指出,不過目前具備運行優化模型能力的終端僅限頭部品牌旗艦手機。
根據目前各家公司對於邊緣端部署的情況推測,即使經過量化、剪枝、蒸餾等方式優化大模型後,仍然需要旗艦版的手機芯片可以勉強承載運行。
假設旗艦機型主處理器頻率應在 2.8GHz 以上,或是價格在 1000 美金以上,根據 IDC 數據,1Q23 全球手機銷量中主處理器頻率超過 2.8GHz 的佔比 36%,銷售價格在 1000 美金以上的手機銷量佔比 13%。
國信證券,隨着 AI 大模型在邊緣端落地,有望推動新一輪換機潮。
