Qualcomm: Running large models on mobile chips, this will be the "Holy Grail"

高通下一代高端芯片驍龍 8 Gen3 正在嵌入 AIGC，該芯片將於今年 10 月底在夏威夷舉行的高通驍龍峯會上首次亮相。

人工智能對於芯片的影響正逐步從雲端延伸至手機端。明年，一旦搭載高通高端芯片的手機推出，普通用户將能夠隨時隨地使用生成式人工智能。

據網絡科技新聞 CNET 當地時間週五文章，高通產品管理高級副總裁 Ziad Asghar 表示，手機嵌入生成式人工智能（AIGC）的解決方案比基於雲的 AIGC 更加個性和有用。

“我認為這將成為聖盃，” Asghar 説，“這是真正的承諾，讓我們對這項技術的發展前景感到非常興奮。”

7 月中旬，高通發佈公告稱，將和 Meta 合作，2024 年推出 “手機版 Llama 2”。

目前，高通正在將 AIGC 嵌入下一代高端芯片中，該芯片將於今年 10 月底在夏威夷舉行的高通驍龍峯會上首次亮相。

在 Asghar 的實驗室中，高通芯片能夠處理 70 億個參數的 AI 模型，雖然遠遠低於 OpenAI GPT-3 模型的 1750 億個參數，但應該適合移動搜索。

“我們實際上將能夠在（夏威夷）峯會上進行設備演示，” Asghar 説。

報道稱，本次峯會上的演示設備可能會搭載高通下一代高端芯片驍龍 8 Gen3。早在今年 2 月份，高通就已經發布了全球首個運行在安卓手機上的圖片生成軟件 Stable Diffusion 的終端演示，該手機搭載了驍龍 8 Gen2 芯片。

在設備上使用生成式 AI 有很多好處。比如，所搜索記錄和個人數據是保密的，不會通過遠程服務器中轉。本地 AI 也比雲端更快，而且可以在飛機上等缺少手機服務的地區工作。

更重要的是，基於設備的解決方案還具有商業和效率意義。高通在上個月發佈的白皮書中表示，隨着機器學習模型變得越來越複雜，運行服務器的成本越來越高。

早在 4 月份，OpenAI 每天要花費大約 70 萬美元讓 ChatGPT 回答提示，並且成本預測是基於 GPT-3 模型，而不是更復雜且維護成本可能更高的 GPT-4 模型。

據悉，高通的解決方案不需要一個完整的服務器羣，而是讓設備現有的芯片大腦做所有需要的思考，因此，不需要額外的成本。

市場研究公司 Techsponential 分析師 Avi Greengart 通過電子郵件告訴 CNET：“在手機上運行人工智能實際上是免費的——你預先為計算能力付費。”

而在手機端以外，高通還計劃在即將舉辦的峯會上宣佈針對 PC 和汽車的 AIGC 解決方案。

Asghar 説：“對於我們這些看着《霹靂遊俠》長大的人來説，KITT（《霹靂遊俠》中那輛會説話的汽車）現在將成為現實。”