qbitai.com
2024.02.21 05:46
portai
I'm PortAI, I can summarize articles.

Sora 新视频只发 TikTok:OpenAI 4 天涨粉 10 万

Sora 新视频在 TikTok 上受到热烈欢迎,短短 4 天涨粉 10 万,50 万赞。OpenAI 的 AI 视频技术引起了很多关注和讨论。Sora 的逼真程度让人难以分辨真假,网友开始怀疑在网上看到的一切。这对短视频创作者产生了冲击,甚至影响到了平台本身。字节跳动和 OpenAI 似乎在 AI 领域将展开一场竞争。在 Sora 火爆之前,字节内部也有类似的技术。Sora 的发布引起了广泛讨论。

梦晨 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI

Sora 新视频,变成 “抖音独占” 了。

悄无声息,OpenAI 正式杀入 TikTok,加上洗脑配乐直接让人刷到停不下来,疯狂引流吸粉中:

短短 4 天,涨粉 10 万,50 万赞——这还是不打枪不宣传的情况下。

这以后,人类创作者还怎么玩?

在 OpenAI 刚开的 TikTok 认证帐号上,悄然更新了不少全新生成视频。

每一个都很有特点,同样引发各路热议。

来感受一下:

a16z 合伙人惊呼,如果这是在信息流里刷出来的,绝对分不出真假。

我看过很多 AI 视频了,但这一条感觉到了转折点。

来到真实的短视频消费场景中,就更显 Sora 与竞品代差明显:太逼真,以至于要特别声明不是真的。

OpenAI 可太担心 AI 视频被当真引起不好影响了,不遗余力的以各种方式提醒 “这是假的!这是假的!”。

网友开始发出这样的预警:

从现在开始,你在网上看到的一切都是值得怀疑的,不要相信你的眼睛。

有句老话叫 “互联网时代,没有人知道你是一条狗”。

现在正式升级成 “Sora 时代,没有人知道你是一条不存在的狗”。

直接搞得不少短视频创作者心态爆炸,要退坑了。

甚至连平台本身都被降维打击。

全球估值第一的独角兽字节跳动,与刚刚跃升第三位的 OpenAI 之间,似乎正酝酿着一场对决。

UGC 王者和 AIGC 新贵之间,终有一战。

实际上,在 Sora 一夜爆火之前,字节内部并不缺乏 AI 视频技术。

甚至其中一款Boximator还被传成是 “中国版 Sora”。

在 Sora 发布之前 Boximator 的论文就已经公布,由字节 AI 实验室总监李航领衔。

其实 Boximator 的功能并非根据纯文字生成视频,而是按照文字提示将静态图片动态化。

它以字节去年 11 月推出的PixelDance为基础模型,加入了新的动作设定方式——

从图像中框选物体,然后设置运动终点或直接绘制轨迹,就能对动态效果进行精细控制。

形式上,Boximator 作为一个插件,与现有的视频扩散模型结合使用,通过冻结基础模型的权重,仅训练控制模块来实现这一功能。

比如,通过框框画画,让小哈基米按照一定的轨迹追着球跑。

效果上,虽然也有 bug(飘走的雨伞没有伞柄),但与 Pika 1.0(中)和 Gen-2(右)相比,Boximator 的动画明显更加完整,也更接近文字提示。

从材质和物理效果上看,也是 Boximator 更胜一筹。

技术层面,从架构上看,Boximator 在视频扩散模型的每个空间注意力块中增加了一个新的自注意力层,用于处理由对象 ID、硬/软标志和边界框坐标编码的控制 token。

为了简化学习 “框 - 对象” 关联的挑战,Boximator 在训练过程中还采用了一种称为自跟踪(self-tracking)的技术。

那么 Boximator 到底算不算 “字节版 Sora”?

字节对此传闻,以辟谣的姿态来回应:

Boximator 是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

Boximator 建立在之前 PixelDance(基础研究)、MagicAnimate(专注于人体动作)等更多字节团队研究基础之上的最新成果。

总的来说,这些技术并非针对 Sora 特意开发,但在 AIGC 大战如火如荼的背景之下,仍不失为一种“战备”

再加上年前原抖音 CEO 张楠卸任,专注于剪映,奔赴 AIGC 风口。

可以说虽然 Sora 的发布很突然,但字节并不是毫无准备,或者说早就在业务推进中感知到了技术趋势。

而相比 OpenAI 与字节这样早晚要有的对决,视频行业上下游其他选手,更像是遭遇了一场飞来横祸。

Sora 的第一刀,其实砍向了 Adobe。

5 天过去了,股价跌跌不休,市值蒸发过百亿美元。

危机时刻,Adobe 刚刚紧急宣布,组建了一个 50 人的 AI 研究团队。

但是这投入的力度,没让大家看出诚意。

29945 员工中的 50 人,只占 0.16%。

Adobe 代表的是沿用近 30 年的视频生产、编辑工具,服务于内容创作者。

不转型就会变成下一个柯达、诺基亚,但转型也被认为面临很大挑战。

比如有人指出,Adobe 坐拥大量数据,但要用过去创作者的成果去训练 AI,就会与这些用户关系紧张。

也正是因此,Adobe 的 AI 生图工具 Firefly 并没有在自家创意作品社区 Behance 的数据上训练,有些束手束脚。

又比如从过去 Adobe 在 AI 生图的表现来看,效果比 Midjourney 尚且很大差距,如今在 AI 视频上又该如何面对 OpenAI 的技术代差。

Adobe 之外,受冲击第二大的就是素材供应商了,代表公司 Shutterstock 的日子也不好过。

连马斯克都认同 “这个行业可能消亡” 的观点。

不过 Shutterstock 也给自己找好了退路,早早与 OpenAI 签订了合作协议,从素材供应商开始转型训练数据供应商。

这几天不断刷屏的 Sora 视频中,就有不少 Shutterstock 图片的影子。

还有人开玩笑说,Sora 名字四个字母不会就是代表 “Shutterstock 原创,AI 搅拌” 吧。

参考链接:
[1] https://www.tiktok.com/@openai
[2] https://boximator.github.io/
[3] https://twitter.com/bilawalsidhu/status/1760076742679552273