英伟达发布新 “核弹”,谷歌聊天机器人也来了,算力股再度上演涨停潮
安信证券指出,ChatGPT、GPT4.0、Microsoft 365 Copilot、文心一言、谷歌 Bird 等相继发布,以 ChatGPT 为代表的 AI 大模型及其初步应用 “一石激起千层浪”,类比 19 世纪末的美国西部 “淘金热” 对铲子、牛仔裤的大量需求,以 GPGPU 为代表的算力基础设施作为 AI 大模型底座将长期稳定受益。
3 月 22 日,算力股(数据中心、AI 芯片、CPO 等)再次大幅走强。
消息面上,隔夜英伟达发布了 ChatGPT 专用 GPU,号称将推理速度提升了 10 倍。
另外近几日,因访问量大增,ChatGPT 全球各地的用户纷纷发现网站弹出报错警告,即使是有特权的 Plus 账户也未能幸免。
安信证券最新研报对 GPT-4 算力需求做了推论:GPT-4 由于复杂度提升、图片识别功能加入,其推测算力需求增至十倍以上。
英伟达发布 ChatGPT 专用 GPU,推理速度提升 10 倍
据澎湃新闻新闻报道,北京时间 3 月 21 日,英伟达 CEO 黄仁勋在 2023 年 GTC 开发者大会上宣布了专为 ChatGPT 设计的推理 GPU(图形处理器)H100 NVL,它将英伟达的两个 H100 GPU 拼接在一起,以部署像 ChatGPT 这样的大型语言模型(LLM)。
黄仁勋表示,当前唯一可以实际处理 ChatGPT 的 GPU 是英伟达 HGX A100,与前者 A100 相比,现在一台搭载四对 H100 和双 NVLINK 的标准服务器速度能快 10 倍,可以将大语言模型的处理成本降低一个数量级。
除定制芯片外,英伟达还发布了突破性的光刻计算库 cuLitho,英伟达宣布,经过与台积电、ASML、新思科技等公司多年的合作,推出全新的计算光刻应用,大大降低芯片代工厂在这一工序上所消耗的时间和能耗,为 2nm 以及更先进制程的到来做好准备。
此外,英伟达还发布了 AI 超级计算服务 DGX Cloud、加速企业创建大模型和生成式 AI 的云服务 NVIDIA AI Foundations 等,以及与 Quantum Machines 合作推出了全球首个 GPU 加速量子计算系统。
黄仁勋表示,眼下整个 AI 产业正处于 “iPhone 时刻”——创业公司正在竞相建立颠覆式的商业模型,而业界巨头也在寻找应对之道,更是放出豪言——英伟达就是要做 AI 圈的台积电!
国内方面,黄仁勋表示,在中国,其有特别定制的 Ampere 和 Hopper 芯片,这些会通过中国云提供商,比如阿里巴巴、腾讯、百度这些企业提供落地的能力,完全相信他们有能力去提供顶级的系统服务,对于中国初创公司一定会有机会来开发自己的大语言模型。
谷歌聊天机器人也来了,AI大模型引领算力层长期受益
当地时间 3 月 21 日周二,美国科技巨头谷歌公司推出了 AI 聊天机器人Bard 的测试版本,以期与 OpenAI 的 ChatGPT 展开竞争。
Bard 将与其谷歌搜索引擎分开运行,目前仅以英语生成答案,目前以先到先得的方式向候补名单的用户提供访问权限。谷歌称随着时间的推移,Bard 将适配更多的语言以及推广到更多的地区。
安信证券指出,ChatGPT、GPT4.0、Microsoft 365 Copilot、文心一言、谷歌 Bird 等相继发布,以 ChatGPT 为代表的 AI 大模型及其初步应用 “一石激起千层浪”.
其表示,随着多模态大模型 GPT-4 的发布,基于文字、图片等垂直场景的应用步伐有望 “从 1 到 10” 加速,类似于移动互联网时代各类型 APP 的百花齐放,其竞争格局也会逐步加剧。而类比 19 世纪末的美国西部 “淘金热” 对铲子、牛仔裤的大量需求,其认为以 GPGPU 为代表的算力基础设施作为AI大模型底座将长期稳定受益。
GPT4 算力需求增至十倍以上
安信证券最新研报对 GPT-4 算力需求及未来趋势做了推论:GPT-4 由于复杂度提升、图片识别功能加入,其推测算力需求增至十倍以上。
其表示,OpenAI 首席执行官 Sam Altman 接受公开采访指出,GTP-4 参数量为 GTP-3 的 20 倍,需要的计算量为 GTP-3 的 10 倍;GTP-5 在 2024 年底至 2025 年发布,它的参数量为 GTP-3 的 100 倍,需要的计算量为 GTP-3 的 200-400 倍。
算力的瓶颈并不体现在算力的绝对大小,而在于实现该算力的成本,从成本的角度,国信证券也对此作了测算,其根据根据 GPT-4 的公开数据,8K 的上下文长度下,每 1000 个 token 的提问成本为 0.03 美金,每 1000 个 token 的回答完成成本为 0.06 美金;32K 的上下文长度下,每 1000 个 token 的提问成本为 0.06 美金,每 1000 个 token 的回答完成成本为 0.12 美金。
其表示,这个算力成本相比与 GPT-3 的成本(每 1000 个 tokens 的算力成本约为 0.02 美金)上升了较高(输入成本增加 50%-200%,输出升本增加 200%-500%),相比于 GPT-3.5-turbo 的成本上升更为可观,输入成本增长了 14-29 倍,输出成本增长了 29-59 倍。
此外,AI 服务器市场的扩容,同步带动高速网卡、HBM、DRAM、NAND、PCB等需求提升。同时围绕解决大算力场景下 GPU“功耗墙、内存墙” 问题的相关技术不断升级,如存算一体、硅光/CPO产业化进程有望提速;先进制程芯片演进中已有的 Chiplet 等技术路径也将受益;Risk-V 由于开源免费、开发者自由度高、自主可控度高、更适应 AIoT 处理器架构需求等优势,带动围绕 AI 场景的参与企业数量提升。