China Business Network
2024.04.28 04:45
I'm PortAI, I can summarize articles.

AI 周报 | 商汤新模型发布后股价大涨;月之暗面否认创始人套现数千万美元

商汤科技发布了 6000 亿参数大模型日日新 5.0,股价因此大涨 30%。该模型号称是中国首个 GPT-4 Turbo 级别的大模型,具备更强的知识、数学、推理及代码能力,并在主流客观评测上达到或超越 GPT-4 Turbo。商汤表示该模型在自然语言能力方面有显著提升,文生图能力达到全球领先水平。此外,英伟达宣布收购以色列公司 Run:ai,以帮助客户更有效地利用其 AI 计算资源。

商汤发布日日新 5.0:对标 GPT-4 Turbo

4 月 24 日,商汤科技股价大涨超过 30% 后紧急暂停交易。就在 4 月 23 日,商汤举办技术交流日活动,推出了 6000 亿参数大模型日日新 5.0,官方发文表示这是 “中国首个 GPT-4 Turbo 级别的大模型”,日日新 5.0 大模型具备更强的知识、数学、推理及代码能力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。

在实际使用中,商汤表示该模型在自然语言能力方面,创意写作、推理以及总结能力均大幅提升,文生图能力也有较大提升,商汤提到其多模态大模型的图文感知能力达到全球领先水平。

点评:本次更新主要聚集增强了知识、数学、推理及代码能力。日日新 5.0 模型能力提升一方面得益于采用混合专家架构(MoE),激活少量参数就能完成推理,且推理时上下文窗口达 200K 左右,其次模型基于超过 10TB tokens 训练、覆盖了数千亿量级的逻辑型合成思维链数据,此外也得益于商汤 AI 大装置 SenseCore 算力设施与算法设计的联合调优。近期 Anthropic、Meta 等海外企业发布最新模型,一些基准测试得分超过 GPT-4,颇有超车 OpenAI 的意思,国内终于也有了商汤日日新 5.0。与此同时,竞争可能要进入新阶段,GPT-5 可能今年夏天要推出,OpenAI 已放出 GPT-5 性能远超 GPT-4 的信号。

英伟达再出手收购以色列公司

当地时间 4 月 24 日,英伟达宣布,已与以色列公司 Run:ai 签订最终收购协议,英伟达认为,这能够帮助客户更有效地利用其 AI 计算资源。Run:ai 成立于 2018 年,是一家基于开源容器编排平台 Kubernetes 的工作负载管理和编排软件提供商,公司产品可提高 GPU 集群的资源利用率。有消息称,英伟达收购 Run:ai 的交易金额为 7 亿美元。英伟达近期还收购了另一家以色列初创公司 Deci,这是一家成立于 2019 年,提供高效的生成式 AI 和计算机视觉模型的公司,其解决方案可通过调整 AI 模型大小使模型在 AI 芯片上更便宜地运行。

点评:英伟达对以色列初创公司多有青睐,2019 年,英伟达还击败英特尔、微软等潜在投资者,以总价约 70 亿美元收购以色列网络技术供应商 Mellanox,这是英伟达布局高速网络的一笔重要收购。从这两笔新收购可以看出,英伟达正在布局 GPU 集群资源高效利用并助力客户降低使用 AI 的成本。目前 AI 大模型算力成本高企有目共睹,大模型训练一次可能需要上千万美元,其背后是 AI 芯片能效难以提升和功耗难以下降。在芯片制程之外,英伟达正在寻求更多解决方案,推动 AI 平民化实现。

苹果收购巴黎人工智能初创公司 Datakalab

据法国媒体报道,苹果收购了专注于 “人工智能压缩算法和计算机视觉技术” 的巴黎初创企业 Datakalab。这笔收购已经于去年 12 月完成,两家公司本月向欧盟委员会报告了这笔交易。

Datakalab 是一家总部位于法国巴黎的 AI 初创公司,专注于人工智能压缩和计算机视觉技术。Datakalab 将自己描述为 “低功耗、运行时高效和深度学习算法方面的专家”,系统可以在设备端运行。这家公司曾经在 2020 年 5 月与法国政府合作,将 AI 工具部署到巴黎的公共交通系统,来检查乘客们是否佩戴口罩。

点评:市场认为,此次收购是苹果更广泛 AI 战略的一部分,旨在将更复杂的 AI 技术引入其设备,例如即将推出的 iOS 18 机型和未来的 Apple Vision Pro。在今年 2 月的财报电话会议上,苹果 CEO 库克曾透露,苹果(在 AI 方面)有一些令他们感到非常激动的事情,将在今年晚些时候讨论。苹果在大模型领域走得不算快,是要自研还是通过收购补全 AI 能力,抑或终端设备直接搭载外部大模型公司的产品,外界还在等苹果作出决策。

OpenAI CEO 投资能源初创公司 Exowatt

据外媒报道,近日能源初创公司 Exowatt 获得了来自 OpenAI CEO 奥尔特曼(Sam Altman)以及硅谷知名风投公司安德森·霍洛维茨 (Andreessen Horowitz) 等投资者 2000 万美元 (约合 1.45 亿元人民币) 的种子轮投资。

Exowatt 于 2023 年成立,旨在用太阳能解决大型数据中心对清洁能源的需求。据悉,与将太阳光直接转化为电能的传统太阳能电池板不同,Exowatt 使用一种独特的方法,涉及储存热量而不是电力,它将太阳能存储在热电池中。该公司开发了一款专为数据中心供电的三合一模块化能源系统,将集热器、热电池,以及能够提供可调度电力和热量的热机进行结合。

点评:这并非奥尔特曼第一次投资能源公司,在此之前,他曾投资 Helion Energy 和 Oklo,这两家分别是专门从事可控核聚变和核裂变发电的能源公司。AI 的尽头是能源,一份研究显示,ChatGPT 一天可能耗电 50 万千瓦时,是美国家庭平均每天用电量的 1.7 万多倍。在此前举办的达沃斯世界经济论坛上,奥尔特曼表示,未来人工智能需要能源方面的突破,因为人工智能消耗的电力将远远超过人们的预期。投资能源企业,意味着 OpenAI 可能寄希望于能源领域的变革为 AI 算力提供支撑。

AI 搜索初创公司 Perplexity AI 获新一轮 6300 万美元融资

4 月 24 日,AI 搜索引擎初创公司 Perplexity AI 在社交平台宣布,获得 6270 万美元融资,估值 10.4 亿美元。本次由 Daniel Gross 领投,Stan Druckenmiller、NVIDIA、Jeff Bezos、Tobi Lutke、Garry Tan、Andrej Karpathy 等跟投。

Perplexity AI 提供生成式 AI 搜索引擎服务,支持用户通过自然语言搜索任何信息,可以把 Perplexity AI 看成搜索引擎版的 “ChatGPT”。

资料显示,Perplexity AI 创立于 2022 年 8 月,同年 9 月获得 310 万美元种子轮融资,12 月发布问答引擎 “Ask”,随后其业务实现飞速增长,4 个月后月活用户便突破 200 万成为生成式 AI 搜索引擎领域的黑马,这也是能获得微软、谷歌、GitHub 等投资的重要原因之一。

点评:Perplexity AI 表示,像 ChatGPT 这种问答模式彻底颠覆了应用的交互模式,简化了大量手动业务,使人们获取信息的方式更加便捷、广阔。同时这也为 Perplexity AI 提供了机会,通过智能技术创新向传统搜索引擎发起挑战。海外对初创公司的大笔融资仍在进行中,可以看出 AI 搜索引擎仍是一个重要方向。

爱诗科技完成 A2 轮超亿元融资,蚂蚁集团领投

4 月 23 日,光源资本官方发文表示,爱诗科技完成 A2 轮超亿元融资,由蚂蚁集团领投,光源资本担任独家财务顾问。至此,爱诗科技一年内累计获得融资超 2 亿人民币,成为中国视频大模型领域融资规模最大的创业公司。据悉,本轮融资将用于进一步迭代自研视频生成大模型,并升级团队,加快实现 AI 视频生成技术的行业应用。

点评:爱诗科技成立于 2023 年 4 月,创始人兼 CEO 王长虎曾任字节跳动视觉技术负责人。爱诗科技于 2024 年 1 月正式发布文生视频产品 PixVerse,官方表示目前月访问量超百万,视频生成量累计超千万,被创作者广泛应用于影视、广告、动漫等内容制作中。创始人王长虎表示,希望未来 AI 原生视频能够融入内容行业的生产和消费链路,为 AIGC 领域带来持续的活力。Sora 推出后,国内视频生成赛道也火热起来,生数科技已拿出 Vidu 大模型,爱诗科技接下来的动作备受期待。

视频大模型 Vidu 发布

在 2024 中关村论坛年会未来人工智能先锋论坛上,清华大学联合生数科技发布中国首个长时长、高一致性、高动态性视频大模型 Vidu。该模型采用团队原创的 Diffusion 与 Transformer 融合的架构 U-ViT,支持一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu 能够根据提供的文本描述直接生成长达 16 秒的高质量视频。

点评:据清华大学教授、生数科技首席科学家朱军介绍,Vidu 采用的是 “一步到位” 的生成方式。与 Sora 一样,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。今年 2 月 Sora 发布后,团队基于对 U-ViT 架构的理解及长期积累经验,在两个月中进一步突破长视频表示与处理关键技术,推出该模型。从发布的视频看,Vidu 画面较真实,但已放出的视频还是几秒的视频,动作衔接还有不流畅之处,后续应还有较大改进空间。

“AIGC 第一股” 出门问问上市首日破发

4 月 24 日,顶着 “AIGC 第一股” 的名号,出门问问(02438.HK)正式登陆港交所,上市即破发,其发行价为 3.8 港元/股,开盘下跌 21.58% 至 2.98 港元/股,截至当日收盘出门问问股价为 3.68 港元/股,下跌 3.16%,市值为 54.89 亿港元。

据出门问问提交的招股书,该公司 2021 年—2023 年的收入分别为 3.98 亿元、5 亿元和 5.07 亿元。2021 年—2023 年出门问问归属于公司权益股东的年内全面亏损总额累计超过 20 亿元,扣除可赎回优先股和普通股的账面值变动、以股份为基础的薪酬和上市开支后,该公司 2021 年的经调整净亏损为 0.73 亿元人民币,2022 年和 2023 年的经调整净利润分别为 1.09 亿元人民币和 0.18 亿元人民币。

点评:出门问问成立于 2012 年,是谷歌前科学家李志飞创办的 AI 公司,以生成式 AI 与语音交互技术为核心业务,拥有自研大模型 “序列猴子”,为内容创作者、企业和消费者等用户提供 AIGC(AI 生成内容)解决方案、AI 企业解决方案、智能设备和配件等服务。出门问问提供的数据显示,该公司目前在全球拥有超过 1000 万名 AIGC 解决方案用户,其中约 84 万名是付费用户。上市首日破发,或意味着资本市场对相关 AIGC 产品的商业化能力仍有顾虑。

腾讯三成代码由 AI 代码助手生成

腾讯云近日发布消息称,腾讯有三成代码是腾讯云 AI 代码助手写的。腾讯研发人员比例超 74%,腾讯基于混元大模型推出了该 AI 代码助手,每天有一半的腾讯员工使用 AI 代码助手,代码生成率超 30%。该助手或 “AI 程序员” 可智能补全代码信息、高效完成编码工作、修复错误代码、解释既有代码、进行人工智能技术对话。腾讯云 AI 代码助手还准备进入金融等更多行业。

点评:越来越多 “AI 程序员” 进入科技大厂工作了。有意思的是,不久前百度透露其每天新增代码中有 27% 是由智能代码助手 Comate 生成的,比例也接近三成。这或许意味着,现阶段 AI 能替代人类程序员做的工作比例大约是 30%,更多可能就不现实了。不久前,Cognition Labs 的 AI 编程产品 Devin 被质疑编程能力存在一定欺骗性,有问题很多是 Devin“自导自演” 修复的。将 AI 作为人类程序员的帮手而不是替代程序员,是目前比较现实的路径。值得期待的是,这些大厂除了自己用代码助手外,后续还会开放给什么行业、带来什么变化。

SK 海力士计划投资超 1000 亿元扩产

有消息称,SK 海力士计划斥资约 20 万亿韩元(约 146 亿美元)在韩国建新的存储芯片产能,进行产能升级,以满足快速增长的 AI 开发需求。这家韩国公司将初步拨出 5.3 万亿韩元,于 4 月底左右开始建设一家新工厂或晶圆厂,计划在 2025 年 11 月完工。

点评:SK 海力士是主要的 DRAM(动态随机存取存储器)厂商之一,目前因 AI 需求火爆,由多颗 DRAM 堆叠而成的 HBM(高带宽存储器)供不应求,SK 海力士是英伟达 HBM 的主要供应商。除了 SK 海力士,三星也在努力挤进英伟达供应链。因 HBM 需求拉升,DRAM 厂商之间的竞争俨然变成 HBM 之争。除了技术领先性之外,谁能更快速增加产能并快速量产,谁就在 AI 时代有更多机会。

月之暗面否认创始人杨植麟套现数千万美元

有消息称人工智能初创公司月之暗面创始人杨植麟通过售出个人持股已套现数千万美金,创始人及相关人员套现金额在 4000 万美金。还有市场传言称,曾参与投资过杨植麟首个创业项目 “循环智能” 的前金沙江创投管理合伙人张予彤已从金沙江创投离职,将加入月之暗面。对于以上市场传言,月之暗面相关负责人回应称,创始人套现消息不实,月之暗面此前已公布员工激励计划,张予彤并未入职月之暗面。

点评:从既往融资看,月之暗面确实 “很有钱”。公司已完成三轮融资,今年 2 月以 15 亿美金投前估值完成超 10 亿美元 B 轮,阿里领投,砺思资本、小红书跟投,投后估值约 25 亿美元,是国内最主要的大模型独角兽之一。月之暗面此前因长文本的聊天应用 kimi 受到市场关注,在资本市场甚至带起一众 “kimi 概念股”。不过,高涨的热度下,外界更期待月之暗面能拿出商用更成功的产品,证明自身具有持续造血的能力。

OpenAI CEO 称 GPT-5 性能远超 GPT-4

4 月 25 日,OpenAI 联合创始人兼首席执行官萨姆·奥尔特曼(Sam Altman)在斯坦福大学发表演讲。在一段流出的视频中,奥尔特曼表示,GPT-5 会更加智能,这将是历史上最令人瞩目的事件之一,GPT-6 则将比 GPT-5 智能很多,而我们远未触及极限。对于 OpenAI 产品迭代,奥尔特曼认为尽早且频繁推出 AI 产品,保持迭代部署非常重要,即便现在看来 ChatGPT 还有点令人尴尬,GPT-4 还显得愚蠢。要让社会为技术进步做好准备,依赖于迭代部署。

点评:随着多个竞争对手发布更新、更强的大模型,外界期待 OpenAI 会拿出什么样的产品应对。奥尔特曼透露 GPT-5 性能远超 GPT-4,更增强了人们的期待。近期关于 OpenAI 下一代大模型的消息频繁传出,中信证券近期研报称,GPT-5 正处于红队测试阶段,预计最快今年夏天面世,GPT-5 预计继续采用 MoE(混合专家模型)架构,有望在多模态理解、长文本输入等方面取得新里程碑。看来,GPT-5 将很快到来。

阿里、百度、腾讯云抢食 Llama 3 算力

Meta 发布 Llama 3 系列两个开源大模型之后,百度、阿里、腾讯等云厂商迅速抢食 Llama 3 的算力部署需求。4 月 22 日,阿里云宣布百炼大模型服务平台推出针对 Llama 3 系列的限时免费训练、部署、推理服务。腾讯云同日宣布腾讯云 TI 平台成为国内首批支持 Llama 3 全系列模型的平台之一。4 月 19 日,百度智能云千帆大模型平台则宣布成为国内首家推出针对 Llama 3 全系列版本训练推理方案的云厂商。

点评:相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。Llama 3 已开源版本的基准测试数据亮眼,指令微调的 Llama 3 8B 在五项基准上得分超 Gemma 7B-1t 和 Mistral 7B Instruct,Llama 3 70B 三项基准超过 Gemini Pro 1.5 和 Claude 3 Sonnet。随着 Grok-1、Llama 3 等相继突破开源模型参数上限,潜在算力需求攀升,如果 Llama 3 参数量超 4000 亿版本性能媲美 GPT-4,部署该模型的需求攀升,接入 Llama 3 的云厂商能吃到的潜在算力红利不会少。

清华大学成立人工智能学院

清华大学成立人工智能学院,聚焦 “人工智能核心基础理论与架构” 和 “人工智能 +X” 两个重点方向,为实现高水平科技自立自强提供有力支撑。图灵奖获得者、中国科学院院士姚期智担任清华大学人工智能学院首任院长。

点评:清华大学是国内最早开展人工智能教学和科研的单位之一。清华大学 1978 年建立 “人工智能与智能控制” 教研组,1985 年成立国内第一个智能机器人实验室,1990 年建成全国首个以 “智能” 命名的国家重点实验室。此后,清华还相继成立脑与智能实验室、未来实验室、人工智能研究院、人工智能国际治理研究院、智能产业研究院。如今一批人工智能创业团队有清华背景,包括智谱 AI、面壁智能、月之暗面、生数科技等,“清华系” 已星光熠熠。此次专门成立人工智能学院并选定重点方向,清华大学有望在人工智能赛道增强引领能力。