Kimi 奇袭百度，文心一言酝酿改名

Kimi 走红，最大的压力将给到百度。因为 Kimi 的背后，已站着阿里的身影。随着阿里通义千问、百度文心一言等宣布免费开放 200 万—500 万甚至 1000 万字的长文本能力后，kimi 长文本推理能力瞬间被赶超，其 “Kimi 概念股” 的热度也开始消散。但短期看，已给用户普及了 “长文本推理能力” 的 kimi 是这波流量的赢家。据 similarweb 数据显示，Kimi Chat 的访问量已从去年十月的 15.6 万，增长至 2024 年 2 月的 279 万。而 3 月 19 日至 3 月 25 日，在月之暗面宣布把长文本能力从 20 万字提升至 200 万字那一周，Kimi 的访问量达到了 394 万次，略高于文心一言的 338 万次，一度跃升为国内网页端周度访问量最高的 AI 应用。据 similarweb 数据显示，整个 3 月 kimi 的访问量达到 1218.6 万次。Kimi 走红的背后，离不开当下阿里激进改革、转型 AI 的支持。有投资人透露，月之暗面新一轮融资完成后，阿里将成为其持股 40% 的单一大股东。不过，为了保证创始人团队保有绝对的决策权和控制权，做了 AB 股处理，拥有足够的投票权。消息称，最新 10 亿美金融资中有 8 亿美金来自阿里，部分资金以阿里提供的算力折算。悄然间，阿里在 AI 赛道已有多个棋子的布局。

Kimi 走红，最大的压力将给到百度。因为 Kimi 的背后，已站着阿里的身影。

就在国内大模型竞争处于焦灼状态时，创业公司月之暗面却靠着 kimi 智能助手的 “200 万字长文本” 率先出圈，甚至还催生了 “Kimi 概念股”。

Kimi 的优势仅领先一个星期。随着阿里通义千问、百度文心一言等宣布免费开放 200 万—500 万甚至 1000 万字的长文本能力后，kimi 长文本推理能力瞬间被赶超，其 “Kimi 概念股” 的热度也开始消散。

但短期看，已给用户普及了 “长文本推理能力” 的 kimi 是这波流量的赢家。据 similarweb 数据显示，Kimi Chat 的访问量已从去年十月的 15.6 万，增长至 2024 年 2 月的 279 万。

而 3 月 19 日至 3 月 25 日，在月之暗面宣布把长文本能力从 20 万字提升至 200 万字那一周，Kimi 的访问量达到了 394 万次，略高于文心一言的 338 万次，一度跃升为国内网页端周度访问量最高的 AI 应用。据 similarweb 数据显示，整个 3 月 kimi 的访问量达到 1218.6 万次。

Kimi 走红的背后，离不开当下阿里激进改革、转型 AI 的支持。

有投资人透露，月之暗面新一轮融资完成后，阿里将成为其持股 40% 的单一大股东。不过，为了保证创始人团队保有绝对的决策权和控制权，做了 AB 股处理，拥有足够的投票权。

“阿里给了比较苛刻的投资条款，但月之暗面当时要想继续留在牌桌上，只能有所妥协。本质上，急需新故事的阿里，和急需资金弹药的月暗各取所需，都得付出部分代价。” 有投资人对《AI 光年》解释。

消息称，最新 10 亿美金融资中有 8 亿美金来自阿里，部分资金以阿里提供的算力折算。

悄然间，阿里在 AI 赛道已有多个棋子的布局。

4 月 10 日早间，马云在阿里内网发表题为《致改革致创新》的帖子，肯定阿里变革一年成效。针对行业未来，马云判断，“三、五年的时间跨度对于互联网领域而言，犹如一个世纪之久，足以发生翻天覆地的变化，AI 时代刚刚到来，一切才刚开始，我们正当其时。”

而对于起了大早的百度和文心一言而言，Kimi 及阿里将成为当下最重要的竞争对手。

一位行业人士对《AI 光年》透露，百度当下最重要的是力出一孔。“目前文心一言的大模型研发、垂直 To B 应用、To C 产品分别在三个不同的事业群，负责人也各不相同。”

比如，负责文心一言自然语言处理底层技术的主力团队是副总裁吴甜，直接向 CTO 王海峰汇报，而百度智能云的负责人是副总裁朱勇直接向百度智能云事业群总裁沈抖汇报。

知情人士对《AI 光年》透露，为了区别文心一言大模型在技术、To C 产品、To B 市场的定位，百度内部高管正讨论，是否需要为文心一言更换新的品牌标识。

当然，与百度相比，目前 kimi 在资金、算力和商业化落地方面依然相对弱势。

“抄近道”

长期看，回归大模型根本，长文本推理能力仅是通往 AGI（通用人工智能）的必要技能之一。在实现 AGI 的漫长征程中，长文本并非唯一标准，多模态学习、神经网络架构创新、应用落地与生态建设、伦理与道德框架构建等各个维度都不可或缺。

虽然 kimi 只做了几天的 “顶流”，但这也不得不让行业思考，为何率先普及大模型 “长文本推理能力” 的会是一家创业公司，而非有资本、有算力、有人才、有应用场景的大厂？

kimi 能抢占用户 “长文本” 的心智并非偶然。在去年多数大模型在 “卷参数、卷开闭源、卷榜单” 忙的不亦乐乎时，2023 年 3 月才成立的月之暗面就以 “抄近道” 的形式在 “百模大战” 中脱颖而出。

多位投资人对《AI 光年》总结月之暗面能从大厂和众多创业公司中 “冒尖” 的原因，主要为以下两点：

一是月之暗面创办之初就从细分领域找到一个刚需的应用场景，并抢占了长文本推理能力的用户认知。

“kimi 现在之所以能引爆长文本推理能力是因为他们很早就开始做这件事情了。去年我见杨植麟（月之暗面创始人）时，他就非常明确要做好大模型长文本这件事儿了。他是行业中第一个讲 ‘长文本’ 的人，大约两周后，OpenAI CEO 奥特曼也在某个采访中才提到这件事。” 月之暗面早期投资人对《AI 光年》解释。

杨植麟曾在此前的采访中把长文本比做 “登月的第一步”，是新的计算机内存。用通俗的话说，大模型若要理解复杂的长文本情境，需要足够大的 “上下文窗口” 或者 “记忆空间” 来容纳并处理这些关联信息，犹如计算机和手机的内存。

去年 10 月，月之暗面推出 Kimi 智能助手时，就在介绍中给自己贴上了 “超大内存” 的标签。贴标签仅是第一步，新技术和新范式最好催化剂永远是用户需求。

从用户的角度看，20 万—200 万字的无损上下文能力，可以帮助用户快速解锁翻译、专业学术论文、法律文书、金融报告等专业使用场景，这对 “小白” 用户更是刚需。

今年 3 月 18 日，Kimi 智能助手无损上下文扩容到 200 万字并引发了百度、阿里等大厂的跟进，又进一步加强了用户对 kimi“长文本推理能力” 的认知。

对于阿里、百度等大厂能快速将长文档处理的文字范围翻倍，天使投资人郭涛对《深网》解释，“长文本处理是自然语言处理的一个分支，各大模型在底层技术上的差别不大，关键看模型的优化、训练策略的调整及数据质量等。”

二是杨植麟等创始团队懂得取舍，提前储备了足够的 “资金” 弹药。

“算力是大模型进化的门槛” 已经成为行业共识。有资料显示，GPT-3.5 在微软 Azure AI 超算基础设施（由 V100GPU 组成的高带宽集群）上进行训练，总算力消耗约 3640PF-days（即每秒一千万亿次计算，运行 3640 天）。

业内一种公认说法是，做好 AI 大模型的算力门槛是 1 万枚英伟达 A100 芯片。这就决定了，大模型的竞争不仅是科技竞争，也是资金实力的较量。对于创业公司来说，要先于对手融到更多的钱，招聘更优秀的人。

不过，一位月之暗面早期投资人对《深网》表示：“资本和算力对于想做 AGI 的公司来说，是一个必要非充分条件，是公司在不同阶段承接用户需求的基础，但大模型竞争的核心还是公司的技术、产品。技术要保证产品足够好用、有价值，然后才是资金上的保障。”

对于 “kimi 如何在 5 个月里用相同成本和设备把模型响应速度提升 3 倍” 的问题，该投资人表示，“技术细节不方便透露。”

“混战刚刚开始”

无论如何，kimi 的威胁已不容小觑。最先在中国推出类似 ChatGPT 聊天机器人软件文心一言的百度，要避免 “起了大早，赶了个晚集” 的尴尬。

用户量仅是基础，回归商业本身，检验一个模式能否长久，关键要看是否有用户及客户愿意为商业化落地买单。

“与百度等大厂相比，目前 kimi 在资金、算力资源、应用场景、商业化落地方面还都存在短板。” 天使投资人郭涛对《AI 光年》分析。

月之暗面的算力短板在 kimi“出圈” 时就已显露。公开资料显示，3 月 21 日，Kimi Chat 曾因流量激增遭遇了短暂的服务中断。为此，月之暗面通过算法优化和算力扩容以保证 Kimi Chat 服务的稳定性和响应速度。

据《AI 光年》获悉，前期火山引擎和阿里云是 kimi 算力的主要提供方，完成今年 A 轮融资后，Kimi 在未来的推理加速或主要依赖阿里云。

在商业化落地方面，百度选择 “两条腿走路”。在 C 端，文心一言 4.0 版正针对个人用户收费。在 B 端，百度采用大模型 + 云服务的方式，通过模型即服务（MAAS）等方式在 B 端收费。

“不过，文心一言 4.0 版在 C 端针对个人用户收费，一定程度上不利于用户的积累和数据的迭代，制约其大模型的发展。” 有投资人分析。

在 C 端商业化落地方面，Kimi Chat 目前处于免费的状态。有投资人透露，Kimi 用户的获客成本达到 12 元-13 元，近一个月来日均下载量为 17805，每天的获客成本至少 20 万元。

在 C 端免费的情况下，Kimi 要向 B 端探索商业化落地。公开资料显示，掌阅科技、华策影视等公司已和月之暗面在影视剧本创作、读者互动体验、内容个性化推荐等方面展开深度合作。对此，二者都没有正面回应，表示一切以公司公开信息为准。

“月之暗面在商业化落地处于一个早期探索的阶段。无论是算力资源、还是应用场景和商业化，百度等大厂比月之暗面等创业公司更有优势。” 有投资人对《AI 光年》透露。

在该投资人看来，在 Meta 开源 Llama 2、埃隆。马斯克开源 Grok 的情况下，仅北京、上海发布的大模型产品就超过 100 多个，国内大模型的混战才刚刚开始。

对此，一位月之暗面早期投资人对《AI 光年》表示，“独立创业公司在大模型领域有两大优势，人才密度和组织效率。在此基础上，只要保证算力资源不短缺，创业公司更有机会。”