
Meta's massive investment in Scale AI triggers a chain reaction: surging demand in the AI data labeling market

Meta Platforms Inc 宣布向 AI 数据标注公司 Scale AI 投资 143 亿美元,收购 49% 股权,使其估值超过 290 亿美元。这一巨额投资引发了云计算与 AI 领域大客户对其他数据标注服务提供商的需求激增,尤其是谷歌、微软和 OpenAI 等超级客户。Scale AI 首席执行官 Alexandr Wang 将加入 Meta 核心研发团队,领导专注于通用人工智能的 “超级智能” 团队。
亚历克斯·拉特纳 (Alex Ratner) 把孩子哄睡后,正准备再工作几小时,突然得知 Facebook 母公司 Meta Platforms Inc(META.US) 将向 AI 数据标注领域领头羊——即 AI 初创公司 Scale AI 投资百亿美元。几分钟之内,这位 Snorkel AI 掌舵者就接到了董事会数个电话,讨论如何争取那些担心 Scale AI 经营模式独立性的客户们,尤其是像谷歌、微软以及 OpenAI 这样的超级客户。
接着是潜在客户们不断发起的询盘——他说短短一日内有数十家之多,在过去一周已形成 “数千万美元” 级别的潜在交易,这些交易处于洽谈各阶段。“每一家负责任的大型语言模型 (LLM) 开发者都将在数据服务供应商多元化上采取不少动作,” 拉特纳表示,“市场将出现重大迁移和重大机会。”
毫无疑问,OpenAI 便是其中之一。这家因 ChatGPT 火爆全球而持续位列全球最顶级 AI 大模型开发者的 AI 独角兽表示,正在逐步停止与 Scale AI 的业务合作。虽然 Scale AI 仅占 OpenAI 数据标注合同的一小部分,但此举凸显出在 Meta 庞大注资后,Scale AI 面临的新挑战。
上周,Meta 宣布对 AI 独角兽 Scale AI 投资高达 143 亿美元,收购 49% 股权,使得这家 AI 初创公司的估值超过 290 亿美元。这项 AI 领域重磅交易一大亮点是 Scale AI 首席执行官 Alexandr Wang 将正式加入 Meta 核心研发团队,领导专注于通用人工智能的 Meta“超级智能” 团队。
这笔巨额投资可谓引发了云计算与 AI 科技领域的大客户们对于其他 AI 数据标注服务提供商们的需求与兴趣激增,他们担心 Meta 会提高其 AI 开发过程的技术可见性,而 Labelbox 和 Turing 等公司的数据标签服务需求正在大幅增加。
Scale AI 竞争对手们喜迎 “泼天富贵”
多年来,Scale AI 一直是帮助大型科技企业与云计算巨头们标注、注释 AI 训练数据领域里最知名的公司之一,吸引了 Meta、OpenAI 等大客户,并跻身估值最高的 AI 初创企业行列。然而,上周 Meta 以高达 143 亿美元购置 Scale AI 49% 股权,并挖走该公司首席执行官 Alexandr Wang 掌舵 Meta 全新的 “超级智能” 部门,这笔交易或将改写 AI 数据标注领域的竞争格局。
如今,Scale AI 最强竞争对手 Snorkel AI,以及 Turing、Invisible Technologies、Labelbox 以及网约车与 Robotaxi 服务领军者优步科技 (Uber Technologies Inc.) 等科技公司都力争提供数据相关服务,以满足 AI 大模型与 AI 应用软件开发者们无底洞般的数据需求。多家公司表示,客户兴趣与需求在 Meta 投资 Scale AI 之后出现激增,部分客户担心 Meta 将更深入了解这些公司的 AI 开发流程以及透过数据标注察觉出一些专有技术。
“需求前所未有。” Labelbox 创始人兼首席执行官 Manu Sharma 表示。该公司获得孙正义掌舵的软银集团以及 Andreessen Horowitz 等机构投资。“我们已与规模最大的 AI 实验室们合作,现在剩余的 AI 超级玩家也在主动联系,我们预计将获得更多业务。”
Scale AI 发言人 Joe Osborne 在一份声明中表示,公司仍保持独立,客户信任依然是其 “最宝贵的资产” 之一。他补充道:“我们保护客户数据、确保客户成功的承诺丝毫未变。” 对于 OpenAI 逐步终止合作一事,Scale AI 则拒绝置评。
在获得 Meta 巨额投资之前,Scale AI 就已面临不确定性。据知情人士透露,Scale 2024 年营收约为 8.7 亿美元,未能达到 10 亿美元的年度目标。不过 Osborne 表示,该公司 2024 年营收同比增长 160%,去年新增业务规模超过 15 亿美元。
随着 AI 训练/推理系统快速发展,包括 Scale AI 官网列出的超级明星客户在内,一些公司也开始重新评估对获得 Meta 巨额注资的该公司数据标注服务的依赖程度。
OpenAI 发言人表示,为支持日益先进的 AI 大模型,OpenAI 早已寻求更专业的多元化数据服务供应商。早在 Meta 入股之前,OpenAI 就在逐步减少对 Scale AI 数据标注服务的依赖。
Scale AI 究竟是何方神圣?
Scale AI 创立于大约十年前,最初依靠大量合同工为早期 AI 开发者系统标注文本和图像。如今,该公司越来越大规模地聘请拥有哲学博士,以及护理、生物科技、物理等知识背景的高级学位且薪酬更高的标注人员来帮助开发更复杂的 AI 大模型,但该领域竞争愈发激烈。
Scale AI 由 Alexandr Wang 于 2016 年创立,早期为机器学习/人工智能大型系统提供数据标注服务。其领先全球的数据标注技术支持微软 (MSFT.US) 和 OpenAI 等大规模客户的 AI 大模型与 AI 开发者体系研发,并在自 2023 年以来的全球生成式 AI 浪潮中崛起为关键角色。该公司此前在 2024 年的最新一轮融资中,整体估值达到约 140 亿美元,投资方主要包括 Meta 和微软。
Scale 首席执行官 Alexandr Wang 或许不像 OpenAI 的 Sam Altman 以及 Anthropic 创始人 Dario Amodei 那样家喻户晓,但其公司已成为 AI 三大支柱——芯片、人才和数据——中数据领域的绝对领导者。这家初创企业通过庞大外包服务团队,为 Meta 和 OpenAI 等科技公司提供 AI 模型训练所需的数据标注服务,并协助开发定制化 AI 应用。
大型科技公司与云计算巨头们通常与多家数据及相关标注服务供应商合作,以建立并微调其 AI 大模型。例如,知情人士称,OpenAI 需要更多专业化数据来支持不同的 AI 大模型开发以及应用,并且已开始转向 Mercor 等其他公司。
在协议宣布后的最初阶段,OpenAI 首席财务官 Sarah Friar 曾表示,该公司计划继续与 Scale AI 合作。“我们不想彻底冻结生态系统,因为并购在所难免,” 她表示。
不过,OpenAI 发言人表示,在过去 6 到 12 个月里,OpenAI 已认定 Scale AI 并非最佳选择,因为其需要的专业数据超出 Scale AI 能提供的范围,且 OpenAI 更加追求服务提供商多元化来规避单一风险。OpenAI 正转向构建更先进的 AI 大模型,例如能够模拟人类推理过程的模型,以及能在非常有限输入下完成任务的代理式模型。Forbes 曾报道,OpenAI 几个月以来一直在减少对 Scale AI 数据标注服务的使用。
OpenAI 大股东微软亦列在 Scale AI 官网客户名单中,但知情人士称微软目前与 Scale AI 并无大型合同,并且这些小额交易不会因 Meta 投资而改变。微软拒绝置评。
Scale AI 也在逐步多元化其服务,比如直接帮助企业构建定制化的 AI 应用软件,并与国防行业合作更紧密。对于欲在该领域扩张的 Meta 而言,国防业务或许也具有长期价值。
虽然 Meta 对 Scale AI 业务的影响还有待观察,但 Scale AI 及其竞争对手大致认同一点:这笔交易将让 AI 市场的另一个长期被忽视的角落获得更多关注。
与新 AI 智能体以及稀缺 AI 算力芯片相比,数据工作历来 “被忽视”,AI 数据标注公司 Toloka AI 联合创始人兼首席执行官 Olga Megorskaya 表示。该公司由云服务商 Nebius 分拆而来,主要客户包括微软、亚马逊 AWS 以及 Anthropic。“这笔交易象征着行业开始认识到人工数据训练对 AI 大模型的重要性。” 她表示。
投资 Scale AI 堪称神来之笔,有望助 Meta 股价踏上长期牛市轨迹
驻扎投资研究平台 Seeking Alpha 的分析师 Geneva Investor 近日表示,社交媒体 Facebook 与 Instagram 母公司 Meta 向 AI 初创公司 Scale AI 的巨额投资,或将大幅提升人工智能相关的业务敞口,并为马克·扎克伯格领导的这家科技巨头股价踏入长牛行情带来 “积极催化剂”。
十多年前收购 Instagram 与 WhatsApp,已经证明 Meta 投资眼光独到。投资组合社区 Cash Flow Club 的意见领袖 Jonathan Weber 表示:“管理层过去在识别并投资优质目标方面表现出色,包括十多年前收购 Instagram,因此我认为溢价过高的风险并不大。”
数字广告投放是 Meta 的核心创收引擎,30 亿用户则堪称基石,Meta 的 AI 广告辅助工具以及 Meta AI 已经持续多个季度帮助 Meta 广告业务营收超预期增长。在 Meta 依赖的数字广告投放领域,拥有 30 亿用户的 Meta 推出的强大开源 AI 大模型以及与之配套的各种生成式 AI 辅助软件工具,推动广告商们覆盖更大范围的潜在用户群体,为 Meta 广告商以及用户们带来基于人工智能的全新广告推荐体验,这也是华尔街分析师们普遍预计 Meta 股价将持续上涨的重要逻辑。
因此对于 Meta 而言,在全球企业抢占 AI 应用高地的背景下,Scale AI 或许将帮助 Meta 打造 “杀手级” AI 应用。Scale AI 作为全球数据标注与模型评测龙头,掌握 AI 时代的 “数据生产资料”。Scale AI 能够提供业内领先的数据标注与模型评测平台,Meta 则急于将 Llama 系列大模型大规模商业化、并将 Meta AI 这一应用深度嵌入社交、广告与硬件生态。Scale AI 可以视作 Meta “AI 护城河” 最后一块关键拼图:即算力 (英伟达 AI GPU+ 自研 ASIC+ 覆盖全球的大规模数据中心)、大模型 (Llama 家族),以及数据 (Scale AI) 三位一体。
