
掐起來了!微軟將推特移除廣告平台,馬斯克反擊:小心我起訴你 “濫用推特數據”

微軟因未來無法免費訪問推特數據頗為不滿,宣佈將推特移除廣告平台,馬斯克立刻反擊,稱微軟非法使用推特數據進行 AI 訓練,訴訟時間到了。
AI 競爭日趨白熱化,馬斯克和微軟間的火藥味也越來越濃。
4 月 19 日,微軟發佈公告稱,自本月 25 日起,其為廣告商提供服務的平台 Smart Campaigns 將不再支持推特。此舉意味着用户無法通過微軟提供的平台創建並管理推文,同時也將無法在 Microsoft Advertising 平台上查看他們廣告及推文的瀏覽量。

Smart Campaigns 為一個面向廣告主的社交媒體規劃和調度工具,可幫助廣告商在該平台管理 Facebook、Instagram 和 LinkedIn 等多個社交媒體。
微軟 “狠狠踹了一腳”,馬斯克隨即發起反擊。
馬斯克於 4 月 20 日發推文稱可能會起訴微軟,指控微軟 “非法” 利用推特數據訓練 AI:
“他們非法使用 Twitter 數據進行訓練。訴訟時間到了。”
而這一切的導火索或許是推特計劃向用户收取高額數據訪問費用,這也進一步證明了在 AIGC 熱潮下,數據對於科技巨頭們顯得更為重要。
訪問推特數據要付費
今年 2 月 2 日,馬斯克宣佈平台 API 訪問將在一週內設置付費牆。一週後,他決定將這一措施的上線推遲到 2 月 13 日。結果因為推特遭遇宕機事件,這個最後期限也過去了,目前這項收費措施沒有實施。
自 2006 年成立以來,學者們可以免費訪問推特的應用程序編程接口(API),從而獲取平台上的各種信息數據。
根據 2020 年的數據來看,已有超過 17500 篇學術論文基於推特平台的數據進行分析。
但推特新規讓大多數依賴 API 訪問開展研究的學者和組織將無法繼續使用推特。
根據推特客户代表在今年 3 月初公佈的一份文件來看,該公司現在計劃就開發者平台向相關用户提供三個級別的企業包 (Enterprise Packages),每年最少支付超 50 萬美元:
其中最便宜的 Small Package 每月需要支付 4.2 萬美元,可以訪問 5000 萬條推文。更高的級別可以讓研究人員或企業訪問更多數據,分別為 1 億條和 2 億條推文,但每月的費用分別為 12.5 萬美元和 21 萬美元。
很多免費使用現有推特 API 的用户都證實了這一消息,他們都收到來自推特公司的電子郵件,稱新的定價計劃將在幾個月內生效。
數據已成 AI 軍備競賽的重要一環
AIGC 熱潮下,數據重要性愈發凸顯,像 GPT 這樣大型語言模型(LLM)的訓練往往需要 TB 級的數據量。
無獨有偶,4 月 18 日,美國訪問量最大的網站之一 Reddit 宣佈,將向使用其 API 數據訓練的公司收取數據使用費,其中便包含微軟、谷歌、OpenAI 等:
谷歌聊天機器人 Bard 的底層算法之一便是用 Reddit 聊天數據訓練而來;OpenAI 的 ChatGPT 也將 Reddit 數據納入大型語言模型的訓練內容。
目前,Reddit 暫未公佈具體收費標準,但其表示,將會給出不同的等級,根據使用者的規模和需求來收費。
華爾街見聞此前分析指出,AI 公司是否有權從互聯網上抓取內容,並把這些數據輸入他們的訓練模型,是一項模糊不明的法律問題。
今年 2 月,在線圖庫 Getty Images 已起訴 AIGC 領域獨角獸 Stability AI,稱其侵犯了 Getty Images 的版權。
此前,OpenAI 首席執行官 Sam Altman 在談到版權問題時表示,ChatGPT 是根據兩年前的數據進行訓練的。他還表示,OpenAI 也在積極和內容公司合作,獲得授權,表示公司願意為特定領域的高質量數據支付高價。
去年,OpenAI 與在線圖庫 Shutterstock 達成了協議,Shutterstock 給 OpenAI 提供數據,OpenAI 給 Shutterstock 提供技術。與此同時,Shutterstock 還設立了一個基金,那些作品被用於 AI 訓練的藝術家提供補償。

