周鸿祎谈大模型扎堆:现在说超越 ChatGPT 的叫吹牛
一天前科大讯飞发布讯飞星火认知大模型,称已经在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。
跨入东方甄选直播间的第一件事,三六零 (601360.SH,简称 “360”) 集团创始人周鸿祎先尝了尝桌上摆放了零食。
5 月 7 日,周鸿祎连轴转场俞敏洪与东方甄选直播间,销售其名下两本书——《超越好奇》《数字安全网络战》。在东方甄选直播间不足十分钟的时间内,《超越好奇》的销量已超过在俞敏洪直播间一个半小时的销售量。
周鸿祎在东方甄选直播间内顺应了董宇辉的主播风格,主要以闲聊为主,浅谈了何为创业、年轻人的好奇心等。在俞敏洪直播间内,周鸿祎谈及对当下火热大模型与 ChatGPT 的看法,他称,以前的人工智能技术很碎片,“不通用” 的问题导致大家对它丧失了热情。
OpenAI 的成功让行业热议是否过去中国公司过于 “功利” 地追求盈利,而不愿长期投入技术。对此,周鸿祎认为,这是因为公司都比较现实,美国公司也一样,Meta(NASDAQ:META) 搞元宇宙亏了 100 亿美元也受不了,OpenAI 最牛的一点就是坚信通用人工智能能成功,且最终把这条路给趟出来了,这里面既有运气也有坚持。
至于目前国内多家公司密集推出大模型产品的现象,周鸿祎称,首先要感谢 OpenAI 与 ChatGPT 把方向跟技术路线探索出来了,第二要感谢开源生态与开放论文,剩下留给公司们要做的主要是工程化的训练层面,这是当下大家都能做大模型的原因。
至于目前国内大模型发展与OpenAI之间的差距,周鸿祎称他同意王小川的观点——差距最少有两年。此前王小川认为OpenAI比国内领先三年时间。追上GPT-3.5可能一年时间是有机会的,但目前OpenAI已经达到GPT-4的级别,GPT-5也在训练过程当中了,因此“追上”需要三年。
回到国内大模型发展问题,周鸿祎表示,互联网公司都去做大模型的原因,是因为没人能笃定某一家公司能做出来成功的大模型产品。但这个技术对中国很重要,它是工业级的,对各行各业都能带来工业革命级的推动。但在早期,周鸿祎认为后来者在大模型技术领域肯定是模仿与 “抄袭”,但在做的过程中一定会越来越了解,未来有可能会弯道超车、后来者居上,“但上来就说能超越,那才叫吹牛呢”,周鸿祎表示。
5 月 6 日,科大讯飞 (002230.SZ) 推出星火认知大模型,科大讯飞董事长刘庆峰表示,认知大模型成为通用人工智能的曙光,科大讯飞有信心实现 “智能涌现”。当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上超过 ChatGPT。
“到今年的 10 月 24 日(科大讯飞全球开发者节),我们希望星火能够在通用认知大模型能力上对标 ChatGPT,在中文上超越 ChatGPT,在英文上达到跟它相当的水平。” 刘庆峰表示。
此前 360 推出大模型产品 “360 智脑”,在俞敏洪直播间,周鸿祎也对 “360 智脑” 进行了多模态演示。在制图环节,“360 智脑” 完成了周鸿祎与俞敏洪合照、松鼠喝啤酒等要求,但在制作 “俞敏洪喝啤酒” 图片环节发生卡顿,据了解是因 “360 智脑” 储备俞敏洪图片不足所致。
5 月 5 日收盘,360 股价 15.45 元,涨 2.73%,总市值 1104 亿元。
文章作者
- 吕倩