
Llama 4 is finally coming this month

Meta 计划在本月晚些时候发布备受期待的 AI 模型 Llama4,尽管发布可能再次推迟。推迟原因包括技术性能未达预期,尤其在推理和数学任务方面。为提升竞争力,Meta 将采用 “混合专家”(MoE)架构,并积极筹划新策略,将 Llama 推向企业市场,可能提供自营 API。
去年春天,Meta 发布的 Llama3 大语言模型曾赢得开发者和独立评测者的一致好评。然而时隔近一年,备受期待的继任者 Llama4 却迟迟未能发布。
据知情人士透露,在至少两次推迟后,Meta 计划在本月晚些时候发布这一备受期待的 AI 模型——但这并非板上钉钉,仍有可能再度延期。
发布延迟背后:技术性能未达预期
据两位了解情况的人士称,发布推迟的关键原因之一,是该模型在开发过程中的技术基准测试表现未能完全达到 Meta 的内部预期,尤其在推理和数学任务方面存在短板。
此外,Meta 内部也对其模型在模拟人类语音对话方面无法与 OpenAI 的顶尖水平相媲美。
技术转向与商业化新探索:拥抱 MoE 与 LlamaX 计划
为了提升 Llama4 的竞争力,Meta 计划在技术路线上做出重要调整。
媒体援引两位知情人士消息称,至少有一个版本的 Llama4 预计将采用 “混合专家”(MixtureofExperts,MoE)架构,而非 Llama 系列此前一直坚持的 “密集”(Dense)模型。
MoE 方法通过将模型划分为多个专注于特定任务的 “专家” 子网络,在处理用户请求时仅激活相关部分,从而有望在提升性能的同时提高运行效率。DeepSeek 及其他多家领先的模型开发者均已采用此技术路线。
值得注意的是,Meta 内部围绕是否从 Dense 转向 MoE 的决策,曾经历了一场长达一年多的激烈技术辩论。最终选择拥抱 MoE,无疑也受到了 DeepSeek 等竞争对手成功实践的部分影响。
在商业化层面,Meta 正在积极筹划新策略,以期更有效地将 Llama 推向企业市场。
媒体援引三位知情人士消息称,公司内部正在深入讨论 Meta 提供自营 API 的模式。不过,目前还不清楚该 API 将依托 Meta 自有数据中心还是租用云服务商服务器运行。
通过提供自营 API,Meta 或能效仿 OpenAI 的模式,向客户提供诸如模型早期访问权限、定制化技术支持等增值服务。
这些讨论是 Meta 内部代号为"Llama X"项目的一部分,该项目源自首席战略官 David Wehner 的团队。通过 Llama X,Meta 还希望招聘工程师、营销人员和销售人员来扩大 Llama 的企业应用范围。
组织重组与产品困境
为了加快发展步伐,Meta 今年 2 月对其生成式 AI 团队的技术领导层进行了调整。该团队任命了当时的 Messenger 负责人 Loredana Crisan 领导 AI 产品的产品管理,并更换了工程负责人 Ryan Cairns 和 Ning Li。随后,Meta 又任命前混合现实技术副总裁 Amir Frenkel 为该团队的工程负责人。
AI 部门负责人 Ahmad Al-Dahle 在内部表示,这些变化将使团队"更快、更有效地行动"并帮助"作为一个团队工作"。值得注意的是,Meta 的生成式 AI 团队在过去一年半从约 500 人急剧扩张到超过 1700 人,即使 CEO 扎克伯格近年来一直在压缩公司成本和人员。
然而,产品方面的进展并不顺利。Meta 已致力于将其智能眼镜应用 Meta View 转变为 Meta AI 的独立应用,希望通过这样的应用更好地展示 Meta AI 的能力。但近几周,该应用在处理分析性、复杂任务方面表现不佳,特别是在审阅大量文档和撰写微妙文本方面存在困难。
Meta 还考虑改变以往的做法,先通过 Meta AI 发布 Llama 4,然后再作为开源软件发布,这与过去同时发布的策略形成对比。这样的变化可能会提升 Meta AI 的使用数据,但也可能疏远那些赞赏公司开源方式的研究人员和开发者。不过,尚不清楚 Meta 是否会推进这一计划。
高额投入、不确定回报
对 Meta 来说,AI 领域的投入巨大。公司正在为开发和运行其模型建设数据中心,今年资本支出计划高达 650 亿美元。更惊人的是,Meta 还在讨论一个可能耗资 2000 亿美元的数据中心项目。
迄今为止,Meta 在 AI 方面的成果喜忧参半。消费者 AI 方面,Meta AI 助手截至今年 1 月拥有超过 7 亿月活用户,但其中部分使用被认为是非主动的,公司也尚未推出早在去年春季就有讨论的付费版本。同时,Meta 去年还裁撤了一组模仿名人和网红的聊天机器人。在云计算服务商向客户销售 Llama 方面,该模型未能获得显著吸引力。
尽管面临这些挑战,据一位接近公司的人士透露,Meta 依然相信 Llama 4 将成为行业领先模型。
尽管挑战重重,一位接近 Meta 的人士透露,公司内部依然坚信 Llama4 将会是一款行业领先的模型。
