Alter聊科技
2023.01.19 13:43
I'm PortAI, I can summarize articles.

AI 生成新春祝福海报,AIGC 从 “炫技” 走向日常

在 ChatGPT 的带动下,AIGC 可以说是过去一年里最火的概念。

就在临近春节的日子里,一款名为 “写作蛙” 的微信小程序正在悄然流行。简单输入几句祝福语,就能自动生成图文并茂的祝福海报,包括一段应景的祝福语和一张节日氛围满满的照片,让 AIGC 和普通网民来了场近距离的邂逅。

深入了解后发现,“祝福海报” 的服务提供商是智谱 AI,一家起源于清华大学计算机系知识工程实验室的创业团队,一直定位于做中国最好的大模型,主导研发了多语言千亿级超大规模预训练模型,构建了高精度通用知识图谱,并将两者有机融合打造了数据与知识双轮驱动的认知引擎。

此外, “祝福海报” 功能基于昇腾 AI,满足了实时的新春祝福生成需求,由西安未来人工智能计算中心提供充裕 AI 算力,北京昇腾人工智能生态创新中心提供技术支持和服务。

理清了这样的背景,“祝福海报” 的走红似乎并不让人意外,就像每年春节期间上演的 “技术暗战”,2023 年的兔年春节注定是人工智能的舞台。

来自大模型的 “祝福”

每一次 “新玩法” 的出现,都离不开背后的技术创新。

看似简单的 “祝福海报”,离不开两个大模型的驱动,一个是千亿参数的 GLM-130B,另一个是文图大模型 CogView2.5。在 “写作蛙” 小程序上生成的每一张祝福海报,本质上都是来自大模型的 “祝福”。

其中 GLM-130B 是智谱 AI 与清华大学 KEG 实验室共同发布的中英双语模型,拥有 1300 亿参数的开源开放中英双语双向稠密模型,可用于问答、对话、写作、填空、写摘要、取标题等应用。

为了让千亿级参数的大模型用起来,智谱 AI 对 GLM-130B 进行了 125TB 中英文文本数据的训练,比其他大模型高出了一个数量级;并在保留中间计算结果为 FP16 的情况下,将 GLM-130B 的权重进行量化,在 INT8 精度的算力下几乎不损失结果,在 INT4 下也只有极小的损失;再加上零/少样本学习、人类反馈、P-tuning 等策略,实现了快速推理、可复现性高、跨平台训练与推理等优势。

按照公开榜单的对比数据,GLM-130B 与 GPT-3 基座模型的水平基本持平。目前已经有中国科协、北京市科委、 华为等数百家机构和个人申请下载了 GLM-130B 模型,在开源社区 GitHub 上获得了 1600 多个星标,千亿参数级高精度的大模型正在被更多人使用。

文图大模型 CogView,同样是智谱 AI 与清华大学联合开发的。

CogView1.0 是与 OpenAI 的 DALL-E 几乎同期的工作,首次实现了中文到图像的生成;基于 CogView2.0 开发的 CogVideo,是当时最大的预训练文本到视频生成模型,并在 CogView2 的基础上构建了迭代版本 CogView2.5;目前智谱 AI 正在与清华大学合作研发 CogView3,据悉效果将会有一个更新的提升。

当然,想要让大模型落地应用,转变为 “祝福海报” 这样的全民应用,算力可以说是不可或缺的一环。

过去短短几年时间里,AI 模型对算力的需求翻了大约 100 万倍,平均每年十几倍,增速甚至超过了对算法精度的需求,以至于传出了 AIGC“日烧百万” 的说法,症结恰恰在于算力。在算力即生产力的铁律下,能否满足大模型训练和推理的算力需求,无疑是 AIGC 能否落地的关键所在。

为 “祝福海报” 担纲算力供给角色的,正是基于昇腾 AI 建设的人工智能计算中心,为大模型的实时推理提供了充沛算力,即使是在春节期间用户量激增的局面下,也足以应对产生的算力挑战。

一场在兔年春节期间燃起的 AIGC 全民热,折射出的是大模型和大算力通力配合的结果。

AIGC 正在走向日常

“祝福海报” 的流行,或许是 AIGC 走进日常生活的序幕。

对 AIGC 的演变趋势做个简单的复盘:2022 年 8 月,免费开源的 Stable Diffusion 爆火,AIGC 的话题被密集讨论;而后科技场所们接连推出了 AIGC 产品,资本市场跟风进入;而后一些商业化的产品出现……然而 StockAI 在内的绘画产品,四个月的时间就因用户付费无法覆盖成本,遗憾宣布关闭平台、退款。

过山车式的起伏,或许有偶然的因素存在,个别的案例无法代表整个行业的兴衰,却也印证了一个屡试不爽的规律:如果一项新技术在 C 端缺少根基和土壤,就想着在市场上攻城略地,结果多半会不尽如人意。

沿循这样的逻辑,“祝福海报” 代表的全民应用,某种程度上为 AIGC 的大众化应用释放了一些积极的信号。

比如智谱 AI 的认知大模型平台(BigModel.ai)上,已经给出了比较丰富的 AIGC 产品矩阵,并提供智能 API 服务。不只是 “祝福海报” 的新玩法,CogView 满足了输入文本生图的需求、“悟能作诗” 可以模仿古代诗人的风格生成诗词、“小呆对话” 能够和 AI 自由对话、CodeGeeX 每天为中国程序员生成超过 100 万行代码,以及数字人、自动生成视频等热门应用。

有了 “祝福海报” 给出的范式,不排除越来越多的 AIGC 能力以小程序、独立应用、插件、API 服务等方式走进大众生活,潜移默化的培养 AIGC 内容的消费习惯,进而不断夯实潜在的商业化土壤。

几乎在 “祝福海报” 流行的同一时间,微软 CEO 纳德拉在《华尔街日报》小组会议上公开表态:“微软将迅速采取行动,将来自 OpenAI 的工具商业化,微软的每一个产品都将拥有一些相同的人工智能能力,能够让该产品彻底改头换面。”

不管是智谱 AI 团队面向大众市场的 “祝福海报” 服务,还是云服务商微软积极拥抱 AIGC 的行为,都意味着在一段时间的摸索、试错、磨合后,AIGC 正在以不同的方式加速落地。2022 年还属于小部分人 “炫技” 的黑科技,有望在 2023 年扩散至寻常百姓家,让 AIGC 的价值被越来越人感知到。

写在最后

刘慈欣在科幻小说《朝闻道》中这样描述技术发展的真理:“人类获得宇宙终极奥秘的起点,始于第一只猿猴对星空的仰望。”

也许用这样的笔触描述 AIGC 有些过于宏大,却不应忽略一个基本事实:一项新技术能够带来多大的改变,根源在于普罗大众的接受与认可,继而不断进阶为不可替代的生产力工具。AIGC 的规模化爆发,可能就始于一张祝福海报。

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.

Like