
DeepSeek's Latest AI Model Delayed After Huawei Chips Fail Amid China's Push To Reduce Reliance On US Companies Like Nvidia: Report

DeepSeek 是一家中国人工智能初创公司,由于华为芯片的技术问题,推迟了其新模型的发布,迫使其依赖美国制造的英伟达处理器。原定于 5 月发布的产品已被推迟,因为 DeepSeek 在使用华为的 Ascend 处理器训练其 R2 模型时遇到了困难。这一挫折突显了中国减少对美国技术依赖的挑战,因为国内芯片在稳定性和支持方面仍然落后。尽管得到了华为的帮助,DeepSeek 仍在努力实现推理任务的兼容性,预计将在未来几周内发布
中国人工智能初创公司 DeepSeek 据报道因 华为技术 的芯片出现技术问题而推迟了新模型的发布,迫使其依赖美国制造的 英伟达 NVDA 处理器。
华为芯片在关键训练阶段遇阻
据《金融时报》报道,DeepSeek 在尝试使用华为的 Ascend 处理器训练其 R2 模型时遇到了持续的技术问题,消息来源对此情况表示知情。
这些困难迫使公司在训练时使用英伟达芯片,而仅在推理任务中依赖华为硬件。
原定于五月发布的产品因这些技术障碍而推迟,导致 DeepSeek 在人工智能竞争中落后于对手,报告称。
中国政府推动国产芯片面临限制
这一挫折凸显了中国减少对美国技术依赖的努力的局限性。北京 reportedly 鼓励企业优先使用国产人工智能芯片,并正在审查英伟达的 H20 处理器订单,以促进本地替代品。
业内人士指出,与英伟达相比,中国芯片在稳定性、软件支持和芯片间连接性方面仍然落后。
华为甚至派遣工程师到 DeepSeek 办公室协助训练,但该公司未能成功使用 Ascend 芯片。报告补充说,DeepSeek 仍在与华为合作,使该模型适用于推理。
随着美中紧张局势加剧,收入、安全与地缘政治交织
本月早些时候,英伟达和 超威半导体公司 AMD 同意将其在中国的芯片销售的 15% 上缴给美国政府,以获得出口许可证。
与此同时,中国当局对英伟达的 H20 芯片表示安全担忧,警告企业避免在政府项目或敏感基础设施中使用这些芯片。
加州大学伯克利分校的人工智能研究员 Ritwik Gupta 对该出版物表示:“仅仅因为我们今天没有看到在华为上训练的领先模型,并不意味着未来不会发生。这只是时间问题。”
DeepSeek R1 模型曾导致英伟达市值蒸发 6000 亿美元
创始人 梁文峰 据报道要求更多时间来推进 R2,该模型也因更新模型的广泛数据标注而面临延迟。中国媒体暗示发布可能在未来几周内进行。
DeepSeek 在一月份推出其 R1 模型时,曾引发英伟达市值 6000 亿美元的蒸发。
当时,英伟达承认了 DeepSeek 的 R1 人工智能模型,表示该公司的工作展示了如何利用测试时间扩展开发新模型,利用广泛可用的模型和计算,完全符合出口管制。
- 新泽西州男子 reportedly 在试图与名为 ‘大姐比莉’ 的 Meta AI 会面时死亡
免责声明: 本内容部分由 AI 工具生成,并由 Benzinga 编辑审阅和发布。
图片来源:mundissima on Shutterstock.com
