AI 還不完美!“公測” 一週,微軟的新 Bing 也犯了不少錯誤

華爾街見聞
2023.02.15 09:40
portai
I'm PortAI, I can summarize articles.

專家認為,基於大型語言模型的人工智能工具存在簡單編造信息的一種傾向。而微軟方面也承認,預計系統在測試期間還可能會繼續犯錯。

公測才一週,微軟的新一代搜索引擎 New Bing 就錯誤頻出。

美東時間 2 月 8 日,在谷歌發佈會上,谷歌的人工智能聊天機器人 Bard 在該產品的第一個演示視頻中犯了一個 “事實錯誤”,成了谷歌當日股價大跌的導火索。作為與 Bard 對標、嵌入 ChatGPT 技術的微軟 New Bing,在最初的 48 小時內,有超過 100 萬人註冊試用,卻也沒有承載住人們的期待。

幾天前,在微軟副總裁 Yusuf Mehdi 對 Bing 的展示中,它需要對服裝公司 Gap 2022 年第三季度財報進行要點整理,但卻給出了一些錯誤的數據,甚至自己編造了一些數據。具體來看:

Bing 給出的 Gap 調整後的運營毛利率為 5.9%。然而在實際財報中,Gap 的運營毛利率是 4.6%,調整後則是 3.9%。

(Gap 2022 年第三季度財報)

Bing 給出的 Gap 毛利率為 37.4%,但實際調整後的毛利率應為 38.7%;現金和現金等價物為 14 億美元,但實際財報中是 6.79 億美元;調整後攤薄每股收益為 0.42 美元,但實際財報裏的數據應是 0.71 美元。

(Gap 2022 年第三季度財報)

Gap 在去年 8 月就下調了全年業績預期,並在對四季度的展望中表示,四季度銷售淨增長率 “可能呈中間個位數下降”,但 New Bing 給出的全年的銷售指引為 “預計銷售淨增長率為低雙位數”。

Bing 甚至還編造了一些財務數據,給出了 Gap 的 “營業毛利率為 7%,攤薄每股收益為 1.6 美元到 1.75 美元之間”,但這些數據在 Gap 三季度財報中並沒有出現。

對於 Lululemon 的財報分析,Bing 也犯了大量的類似錯誤。New Bing 給出的 Lululemon 毛利率為 58.7%,實際上應為 55.9%;營業毛利率為 20.6%,實際上應為 19.0%;攤薄每股收益為 1.65 美元,實際上應為 2.00 美元。

(Lululemon 2022 年第三季度財報)

獨立搜索研究員 Dmitri Brereton 週一在社交平台上寫道:

在演示過程中,Bing 的一些答案完全錯誤。但沒有人注意到。

相反,所有人都迫不及待地跳上這趟 “炒作” 的列車。

Brereton 指出,除了財務數據錯誤之外,Bing 為在墨西哥城旅行的遊客們也提供了一些存在問題的建議。Bing 推薦的幾個酒吧,沒有任何客户評價、聯繫方式或者商店介紹,但這些信息都可以在谷歌地圖或者商店的 Facebook 主頁上找到。此外,Bing 給出的營業時間、商品價格和商店地址都存在誤差。

專家對此表示,這可能是它的一種 “幻覺”(hallucination),基於大型語言模型的人工智能工具存在簡單編造信息的一種傾向。ChatGPT 這類大型語言模型的生成,隨着生成的序列越長,越容易脱離給定的數據,生成各種虛假錯誤信息。

而微軟方面表示,他們知道這些錯誤,預計 Bing 也會犯錯。微軟發言人週二在接受媒體採訪時表示:

我們注意到了這份報告,並分析了調查結果,正努力改善用户體驗。

我們意識到仍有工作要做,預計系統在測試期間還可能會繼續犯錯,正因如此,反饋才至關重要,這可以幫助我們學習和改進模型。