辉常观察
2024.05.15 01:14
I'm PortAI, I can summarize articles.

OpenAI 的奇点时刻

当 OpenAI 首席技术官米拉·穆拉提发布桌面版本的 ChatGPT 和新的旗舰模型—GPT-4o,OpenAI 的发展,进入到了一个真正意义上的奇点时刻。

OpenAI 的短短 26 分钟的发布会,却依然引发了不少波澜。

无论是 ChatGPT-4o 的完全免费,抑或是推出 PC 桌面版的 ChatGPT,无一不为我们显示出 OpenAI 的领先。

然而,如果仅仅只是一味地尬吹 OpenAI 的领先,必然是没有太多裨益的。

原因在于,OpenAI 的确在很多方面具备着相对领先的优势,这样一种领先,并不仅仅只是体现在它与谷歌的差距上,同样还体现在它与中国 AI 玩家们的差距上。

透过 OpenAI 的发布会,我们需要更多地看到的是,时下的 AI 行业,正在发生着的深刻变化,并由此来找到适合当下发展趋势的新机会。

如果一定要找到 OpenAI 的这场短短发布会带给我们的启示的话,我更加愿意将其看成是 AI 正走在互联网道路上的一种直接体现。

以此为开端,AI 将会真正从一个局限于实验室里的存在,成为一个被越来越多的大众所认识、所使用、所接受的存在。

如果我们将 ChatGPT-4o 之前的 OpenAI,看成是一个布道者的话,那么,ChatGPT-4o 之后的 OpenAI,则更像是一个实践者。

一句话,OpenAI 正在 open AI。

未来,我们将会看到越来越多的场景和行业当中,开始出现 AI 的影子,我们将会看到越来越多的玩家们,开始加入到普及与落地 AI 的过程当中。

认识到这一点,我们或许才能更好地把握 OpenAI 这样一个短短 26 分钟的发布会,带给我们的更深层次的意义。

OpenAI 这样一个发布会扔出的「王炸」,其实就是推出了 ChatGPT-4o 这样一个完全免费的应用。

从表面上来看,OpenAI 之所以会进行完全免费,其中一个很重要的原因在于,它的用户的增长业已进入到瓶颈期,为了拓展更多的用户,OpenAI 便开始通过免费的方式来获得新的用户。

自去年 ChatGPT 推出后,在 2023 年 5 月达到流量峰值,网络访问量达到 18 亿次,但之后流量出现下滑情况。2024 年 3 月,ChatGPT 的访问量依然稳定在了 18 亿次,不再有明显增长。

当 OpenAI 通过 ChatGPT-4o 完全免费进一步降低使用门槛,首先起到立竿见影效果的,便是用户量的增长。

对于业已陷入到用户增长瓶颈期的 OpenAI 来讲,无疑是一个非常不错的尝试。

如果我们将 ChatGPT-4o 的完全免费,看成是 OpenAI 为了提升用户量所做的一次尝试的话,那么,ChatGPT-4o 此次将更多的场景应用到端侧模式以及代码生成能力的场景应用,则是将 OpenAI 的用户量的增长拓展到了更为广阔的领域之中。

这其实是和互联网行业的发展,有着异曲同工之处的。

我们都知道,早在互联网尚未风靡的时候,人们对于互联网的使用,并不是像现在这样普及,甚至在很多情况下,人们对于互联网的使用,如同现在人们对于 AI 的使用一样,必须要付费。

很显然,通过付费的方式,很难让互联网释放出更大的发展潜能,很难成就一个叫做「互联网」的时代的。

于是,为了让互联网释放出更大的发展潜能,为了让互联网真正成就一个时代,必然需要做的,便是将以往收费的互联网服务进行免费,并且真正用这样一种方式来实现互联网的最大限度的普及。在此基础上,我们再去寻找「互联网 +」的商业模式。

可以说,免费,真正让互联网成为了一种「基础设施」,而免费同样促进了「互联网 +」模式的不断成熟和完善。

对标到 AI 的身上,其实同样如此。

毋庸置疑的是,OpenAI 通过 ChatGPT 让我们看到了 AI 的强大,让我们看到了对于效率提升的积极影响。

然而,在很多时候,人们对于 AI 的感知依然是在收费的情况下完成的,依然是受到收费的掣肘的。

在这样一种情况下,AI 很难成为一种基础设施,更加难以释放出新的更大的发展潜能的。

因此,如果一定要找到 AI 走在互联网上道路上的具体表现的话,完全免费,并以此来促成 AI 最大限度的普及,并以此来孕育出更多新的商业模式,无疑是最直接的表现。

当 OpenAI 撕开了免费的口子,我们或许还将会在未来看到更多玩家加入其中,从而真正将人们带入到人人皆可使用 AI,万物皆可 AI 的全新发展阶段。

除了 ChatGPT-4o 的完全免费之外,OpenAI 在发布会上更多地为我们展示的是,GPT-4o 的模型能力、基准测试、模型安全性和局限性。

模型能力上,在 GPT-4o 之前,ChatGPT 语音模式对话的平均延迟为 2.8 秒 (GPT-3.5) 和 5.4 秒 (GPT-4)。

如今借助 GPT-4o,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,这意味着所有输入和输出都由同一神经网络处理。

传统基准测试层面上,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上均处于高位。

在 5 次 MMLU(常识问题)上,GPT-4o 创下了 87.2% 的新高分,远超谷歌 Gemini Pro 1.5、Ultra 1.0,以及自己的 GPT-4T 和 GPT-4 等。

模型安全性和局限性上,GPT-4o 通过过滤训练数据和通过训练后细化模型行为等技术,在跨模式设计中内置了安全性。以及创建了新的安全系统,为语音输出提供防护。

根据对网络安全、CBRN、说服力和模型自主性的评估表明,GPT-4o 在这些类别中的任何类别中的得分都不高于中等风险,而且团队继续降低发现的新风险。

如果要找到 ChatGPT-4o 这些特征为我们传递出来的信息的话,说到底,就是为了让更多的用户可以更加快速、更加安全、更加高效地使用 ChatGPT-4o。

简单来讲,OpenAI 在 ChatGPT-4o 上的这些进化,正是为了其产品更好地进行商业化。

透过这一点,我们同样可以看出,AI 的发展,正走在互联网的道路上。

我们都知道,在互联网时代,我们经历了 DOS 系统,Windows 系统以及后来的 iOS 系统、安卓系统等操作系统。

如果对这些操作系统进行总结和定义的话,说到底,它们进行不断地升级的一个终极目的,就是为了让互联网可以更好地商业化,可以让互联网更好地与商业场景结合在一起。

当互联网有了这样的进化,我们才看到了衍生于互联网的门户网站、「互联网 +」应用以及移动互联网时代所诞生出来的各式各样的应用。

可以说,互联网的不断的迭代和升级所带来的一个最为直接的结果,便是互联网的商业化的普及。

对于 AI 来讲,其实,同样是在遵循这样一种发展脉络。

说到底,AI 最终还会要落脚在商业化上,才能够真正将自身的发展潜能释放到最大。

否则,所谓的 AI,依然仅仅只是一个讲给资本市场听的美好的故事,当资本的热情不再,特别是当 AI 的发展真正需要自我造血的时候,它的发展,依然还是会面临这样那样的问题。

无论是百度的李彦宏,还是 360 的周鸿祎,乃至是金沙江创投的朱啸虎,其实都在不同的场合表达过对于 AI 的这样一种看法。

说到底,他们所表达的观点,其实都是一个中心思想。

这样一个中心思想,其实就是让 AI 更多地聚焦场景和应用,更多聚焦在商业化上,而不仅仅只是一个停留在实验室里,并不仅仅只是局限于有限场景之中的小众存在。

透过 ChatGPT-4o 的发布,我们可以看出,OpenAI 在探索和实践商业化的方式和方法,以此为开端,我们将会看到更多有关 AI 沿着互联网的道路发展的新迹象的出现。

回顾互联网的发展,不难看出,互联网之所以会获得如此大的发展,之所以会成为人们的一种生活方式,其中一个很重要的原因在于,互联网得到了最大限度的普及。

时至今日,互联网,业已成为了几乎所有人的生活方式。

以直播、短视频为主导的全新时代的来临,更是将互联网的普及率,带入到了一个全新的高度。

对于 AI 来讲,欲要获得新的发展,欲要成为一种全新的生活方式,必然需要重新演绎以往互联网所走过的道路,必然让以往互联网所做的普及的动作,重新在自己的身上得到演绎。

如果我们要寻找 OpenAI 这样一场发布会提供给我们的新启示的话,它不断地让 AI 进行普及,不断地将 AI 成为一个被 B 端和 C 端都能够接受的存在,或许才是值得关注的另外一个方面。

当 OpenAI 以 ChatGPT 的聊天机器人出现在人们的面前,它仅仅只是在聊天这样一个场景下存在,它仅仅只是解决的是较为简单的逻辑推理的能力。

时至今日,ChatGPT 早已不再是简单意义上的聊天机器人,它不仅可以聊天对话、文生图片,还能文生视频,甚至还可以像人的反应速度一样与人们进行交互。

OpenAI 表示,GPT-4o(“o” 代表 “omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

GPT-4o 可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。

它在英语文本和代码上的性能与 GPT-4 Turbo 的性能相匹配,在非英语文本上的性能显着提高,同时 API 的速度也更快,成本降低了 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

说到底,OpenAI 其实就是通过不断地提升 ChatGPT 的交互能力来提升人与 AI 沟通和交流的门槛,不断地让 OpenAI 的产品更好地进行普及。

如果将 OpenAI 在交互上的提升与互联网以往的发展脉络进行总结和定义的话,它们共同的终极目的,其实就是为了让 AI 可以更好地普及,并且真正让 AI 成为一种全新的生活方式。

因此,如果我们要找到 OpenAI 的发布会给我们的新启示的话,不断地让 AI 普及,不断地沿着互联网的方向前进,无疑是另外一个最值得我们关注的方面。

正如 OpenAI CEO 奥特曼在发布会后的博客里所说的那样:

「我为我们能在 ChatGPT 中免费提供世界上最先进的模型感到非常自豪,这一切都没有广告或其他干扰。最初,OpenAI 的设想是开发 AI 技术,并利用它为全球带来益处。然而,现实是我们开发了 AI 技术,而其他人则利用这些技术创造了令全世界受益的杰出成果。作为一家企业,我们有很多服务是需要收费的,但不妨碍我们支持向全球数十亿用户提供免费的顶尖 AI 服务。」

「新推出的语音(及视频)模式是我使用过的最佳计算界面。它给人一种电影中 AI 的感觉,让人不禁惊叹这竟是真的。达到与人类相似的响应速度和表达能力,标志着一个重大的转变。最初的 ChatGPT 已经展示了语言界面的潜力;而这一新技术则在体验上有了质的飞跃。它反应迅速、智能、有趣、自然且实用。以前,我与计算机对话从未感觉如此自然;但现在,我终于有了这种感觉。随着我们逐步增加个性化选项、获取个人信息的权限、代表用户执行操作的能力等功能,我真的可以预见到一个激动人心的未来:我们能够利用计算机完成以往无法想象的更多事务。」

结语

如果一定要寻找 OpenAI 这样一场短短 26 分钟的发布会传递出来的信息的话,OpenAI 正走在互联网的道路上,无疑是再清晰不过的了。

可以说,通过这样一场发布会,OpenAI 完成了从 AI 布道者向实践者的完美转身。

对于 AI 来讲,其实是需要这样一场免费化、普适化和商业化的。

至此,OpenAI 开始 open AI。

原因在于,只有经历了这样一场普及和商业化,AI 的发展,才不仅仅只是一个停留在实验室里的存在,才不仅仅只是一个小众化的存在,而是成为了一个类似互联网的,可以与万千场景,千行百业都实现了深度融合的存在。

以此为开端,ChatGPT 才能真正成为英伟达 CEO 黄仁勋口中的「iPhone 时刻」,而 GPT-4o,无疑是 OpenAI 的奇点时刻。

—完—

作者:孟永辉,资深撰稿人,专栏作家,行业观察家,知名 KOL,数字经济学者。

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.

Like