
Hong Kong Stock Concept Tracking | DeepSeek training cost is less than one-twentieth of GPT, AI applications may usher in low-cost expansion (with concept stocks)

DeepSeek 的训练成本仅为 GPT 的二十分之一,且其新发布的 R1 模型性能可媲美 OpenAI 的 O1。该公司成立于 2023 年,由金融圈知名人士梁文锋操盘。DeepSeek-V3 的研发费用为 558 万美元,训练仅用 2048 张 H100 GPU,时间为 53 天,显示出中国在 AI 领域的创新潜力,可能重塑全球 AI 竞争格局。
AI 公司 DeepSeek 刷屏美国各大主流媒体和社交网站。有人猜测,可能是因为:1 月 20 日 DeepSeek 发布了可以媲美 OpenAI O1 的 R1 模型。
天眼查显示,DeepSeek 的开发者为杭州深度求索人工智能基础技术研究有限公司,该公司成立于 2023 年 7 月份,由宁波程恩企业管理咨询合伙企业和梁文锋共同持股。
据了解,深度求索背后的操盘手梁文锋是金融圈成名已久的高手。他创立的幻方量化,为国内量化私募巨头之一。
值得注意的是,据湛江发布消息,性能比肩 GPT-4o 的 DeepSeek-V3,投入研发费用为 558 万美元,训练成本不到 GPT-4o 的 1/20,且只用了 2048 张 H100 的 GPU 集群,用时仅 53 天。在同等水平下,哪怕是全球 AI 第一梯队的头部公司,至少也要用到 1.6 万张以上的 GPU 进行训练。
智通财经 APP 获悉,DeepSeek 大模型以极低成本 (600 万美元) 和少量芯片 (2000 块) 实现了与 OpenAI 等巨头相媲美的性能,挑战了"唯有科技巨头才能研发尖端 AI"的行业共识。
其成功源于中国工程师在美国芯片限制下的创新突破:通过开源生态协作、算法优化及资源整合,将黑市芯片与量化交易公司的算力积累转化为技术优势。
这种模式不仅揭示美国技术封锁的意外反效果,更预示中国可能通过开源主导权重构全球 AI 竞争格局,使低成本创新成为颠覆行业的新路径。
市场理解,低成本可获得最佳模型效果,对前期算力堆砌大模型逻辑否定。同时,也对中小型 AI 创新企业构成实质利好。
中信证券发布研报称,近日,DeepSeek-V3 的正式发版引起 AI 业内广泛高度关注,其在保证了模型能力的前提下,训练效率和推理速度大幅提升。
中信证券认为,DeepSeek 新一代模型的发布意味着 AI 大模型的应用将逐步走向普惠,助力 AI 应用广泛落地;同时训练效率大幅提升,亦将助力推理算力需求高增。
伴随模型能力升级,Agent 等应用形式有望加速落地,带动办公、教育、管理、端侧、具身智能等应用领域公司加速兑现业绩弹性。中信证券持续看好 AI 产业链的加速落地机遇。
AI 应用相关港股企业:
医渡科技(02185)、创新奇智(02121)、汇量科技(01860)、第四范式(06682)、粉笔(02469)、晶泰控股-P(02228)等。
