Qualcomm: Running large models on mobile chips, this will be the "Holy Grail"

華爾街見聞
2023.08.26 10:58
portai
I'm PortAI, I can summarize articles.

高通下一代高端芯片驍龍 8 Gen3 正在嵌入 AIGC,該芯片將於今年 10 月底在夏威夷舉行的高通驍龍峯會上首次亮相。

人工智能對於芯片的影響正逐步從雲端延伸至手機端。明年,一旦搭載高通高端芯片的手機推出,普通用户將能夠隨時隨地使用生成式人工智能。

據網絡科技新聞 CNET 當地時間週五文章,高通產品管理高級副總裁 Ziad Asghar 表示,手機嵌入生成式人工智能(AIGC)的解決方案比基於雲的 AIGC 更加個性和有用。

“我認為這將成為聖盃,” Asghar 説,“這是真正的承諾,讓我們對這項技術的發展前景感到非常興奮。”

7 月中旬,高通發佈公告稱,將和 Meta 合作,2024 年推出 “手機版 Llama 2”。

目前,高通正在將 AIGC 嵌入下一代高端芯片中,該芯片將於今年 10 月底在夏威夷舉行的高通驍龍峯會上首次亮相。

在 Asghar 的實驗室中,高通芯片能夠處理 70 億個參數的 AI 模型,雖然遠遠低於 OpenAI GPT-3 模型的 1750 億個參數,但應該適合移動搜索。

“我們實際上將能夠在(夏威夷)峯會上進行設備演示,” Asghar 説。

報道稱,本次峯會上的演示設備可能會搭載高通下一代高端芯片驍龍 8 Gen3。早在今年 2 月份,高通就已經發布了全球首個運行在安卓手機上的圖片生成軟件 Stable Diffusion 的終端演示,該手機搭載了驍龍 8 Gen2 芯片。

在設備上使用生成式 AI 有很多好處。比如,所搜索記錄和個人數據是保密的,不會通過遠程服務器中轉。本地 AI 也比雲端更快,而且可以在飛機上等缺少手機服務的地區工作。

更重要的是,基於設備的解決方案還具有商業和效率意義。高通在上個月發佈的白皮書中表示,隨着機器學習模型變得越來越複雜,運行服務器的成本越來越高。

早在 4 月份,OpenAI 每天要花費大約 70 萬美元讓 ChatGPT 回答提示,並且成本預測是基於 GPT-3 模型,而不是更復雜且維護成本可能更高的 GPT-4 模型。

據悉,高通的解決方案不需要一個完整的服務器羣,而是讓設備現有的芯片大腦做所有需要的思考,因此,不需要額外的成本。

市場研究公司 Techsponential 分析師 Avi Greengart 通過電子郵件告訴 CNET:“在手機上運行人工智能實際上是免費的——你預先為計算能力付費。”

而在手機端以外,高通還計劃在即將舉辦的峯會上宣佈針對 PC 和汽車的 AIGC 解決方案。

Asghar 説:“對於我們這些看着《霹靂遊俠》長大的人來説,KITT(《霹靂遊俠》中那輛會説話的汽車)現在將成為現實。