版权商准备和微软、谷歌、OpenAI 打官司!训练 AI 模型,也得付钱?
“我们的内容有价值,是真正的人类辛苦劳动的成果,却不断被用来为其他人创造收入,我们必须得到补偿。”
AI 聊天机器人凭借其出色的能力,成为环球市场的焦点,让互联网公司之间掀起了新一轮 “军备竞赛”。
但是,用于训练人工智能的数据,如新闻、书籍等,许多都是有版权归属的,AI 公司该为使用这些内容付费吗?
据媒体报道,近期,出版行业的高管,已经开始审查他们的内容在多大程度上被用于 “训练” ChatGPT 等 AI 聊天机器人,他们应该如何获得补偿,以及他们有哪些法律选择。
新闻媒体联盟 (News Media Alliance) 执行副总裁兼总法律顾问 Danielle Coffey 表示:
“我们的内容有价值,是真正的人类辛苦劳动的成果,却不断被用来为其他人创造收入,我们必须得到补偿。”
据知情人士向媒体透露,美国内容社区 Reddit 已经与微软就其内容在 AI 训练中的使用进行了商议。
此外,拥有《华尔街日报》、《纽约邮报》、《巴伦周刊》等媒体的美国新闻集团正准备采取行动。
首席执行官 Robert Thomson 在最近的一次投资者会议上表示,他已经 “开始与某一方进行讨论。”
Robert Thomson 认为:
“很明显,他们在使用独家内容——显然,我们应该因此得到一些补偿。”
除了出版商,图片作品的版权方也在向 AIGC 公司讨要授权费。今年 2 月,在线图库 Getty Images 已起诉 AIGC 领域独角兽 Stability AI,称其侵犯了 Getty Images 的版权。
AI 公司是否有权从互联网上抓取内容,并把这些数据输入他们的训练模型,是一项模糊不明的法律问题。
在中国、美国、日本、欧盟等地的法律中,均有 “合理使用” 条款,允许个人、公司在某些情况下未经许可使用受版权保护的材料。
许多 AI 公司也援引这一条款为自己申辩,但出版商则认为,大量使用受版权保护的内容训练 AI,是对这一特许权利的滥用。
并且,人工智能工具可能会让他们的网站上损失流量和广告收入。在搜索引擎时代,用户还需要点进网页找资料,但现在,大部分时候,搭载 GPT-4 引擎的 Bing 都能直接帮你生成答案,几乎不需要再查阅网页。
此前,OpenAI 首席执行官 Sam Altman 在谈到版权问题时表示,ChatGPT 是根据两年前的数据进行训练的。他还表示,OpenAI 也在积极和内容公司合作,获得授权,表示公司愿意为特定领域的高质量数据支付高价。
比如,去年,OpenAI 与在线图库 Shutterstock 达成了协议,Shutterstock 给 OpenAI 提供数据,OpenAI 技术给 Shutterstock 提供技术。与此同时,Shutterstock 还设立了一个基金,那些作品被用于 AI 训练的艺术家提供补偿。
现在的问题是,AI 工具仍处于进入商业应用的早期,如果真的要让 AI 公司为大规模复制作品支付许可费用,在实践中也很难完成。对版权问题,整个行业还没有形成固定的准则。
我们此前提到,涉及软件公司 Adobe 是解决 AI 版权问题的先行者。它在最近推出新工具"Firefly" (萤火虫) ,致力于让 AI 生成作品安全地商用,同时给让艺术家自主选择,要不要把作品交给 AI 训练。Adobe 希望能塑造行业的新标准,但这一切,都需要时间。