AI 還不完美！“公測” 一週，微軟的新 Bing 也犯了不少錯誤

專家認為，基於大型語言模型的人工智能工具存在簡單編造信息的一種傾向。而微軟方面也承認，預計系統在測試期間還可能會繼續犯錯。

公測才一週，微軟的新一代搜索引擎 New Bing 就錯誤頻出。

美東時間 2 月 8 日，在谷歌發佈會上，谷歌的人工智能聊天機器人 Bard 在該產品的第一個演示視頻中犯了一個 “事實錯誤”，成了谷歌當日股價大跌的導火索。作為與 Bard 對標、嵌入 ChatGPT 技術的微軟 New Bing，在最初的 48 小時內，有超過 100 萬人註冊試用，卻也沒有承載住人們的期待。

幾天前，在微軟副總裁 Yusuf Mehdi 對 Bing 的展示中，它需要對服裝公司 Gap 2022 年第三季度財報進行要點整理，但卻給出了一些錯誤的數據，甚至自己編造了一些數據。具體來看：

Bing 給出的 Gap 調整後的運營毛利率為 5.9%。然而在實際財報中，Gap 的運營毛利率是 4.6%，調整後則是 3.9%。

（Gap 2022 年第三季度財報）

Bing 給出的 Gap 毛利率為 37.4%，但實際調整後的毛利率應為 38.7%；現金和現金等價物為 14 億美元，但實際財報中是 6.79 億美元；調整後攤薄每股收益為 0.42 美元，但實際財報裏的數據應是 0.71 美元。

（Gap 2022 年第三季度財報）

Gap 在去年 8 月就下調了全年業績預期，並在對四季度的展望中表示，四季度銷售淨增長率 “可能呈中間個位數下降”，但 New Bing 給出的全年的銷售指引為 “預計銷售淨增長率為低雙位數”。

Bing 甚至還編造了一些財務數據，給出了 Gap 的 “營業毛利率為 7%，攤薄每股收益為 1.6 美元到 1.75 美元之間”，但這些數據在 Gap 三季度財報中並沒有出現。

對於 Lululemon 的財報分析，Bing 也犯了大量的類似錯誤。New Bing 給出的 Lululemon 毛利率為 58.7%，實際上應為 55.9%；營業毛利率為 20.6%，實際上應為 19.0%；攤薄每股收益為 1.65 美元，實際上應為 2.00 美元。

（Lululemon 2022 年第三季度財報）

獨立搜索研究員 Dmitri Brereton 週一在社交平台上寫道：

在演示過程中，Bing 的一些答案完全錯誤。但沒有人注意到。

相反，所有人都迫不及待地跳上這趟 “炒作” 的列車。

Brereton 指出，除了財務數據錯誤之外，Bing 為在墨西哥城旅行的遊客們也提供了一些存在問題的建議。Bing 推薦的幾個酒吧，沒有任何客户評價、聯繫方式或者商店介紹，但這些信息都可以在谷歌地圖或者商店的 Facebook 主頁上找到。此外，Bing 給出的營業時間、商品價格和商店地址都存在誤差。

專家對此表示，這可能是它的一種 “幻覺”（hallucination），基於大型語言模型的人工智能工具存在簡單編造信息的一種傾向。ChatGPT 這類大型語言模型的生成，隨着生成的序列越長，越容易脱離給定的數據，生成各種虛假錯誤信息。

而微軟方面表示，他們知道這些錯誤，預計 Bing 也會犯錯。微軟發言人週二在接受媒體採訪時表示：

我們注意到了這份報告，並分析了調查結果，正努力改善用户體驗。

我們意識到仍有工作要做，預計系統在測試期間還可能會繼續犯錯，正因如此，反饋才至關重要，這可以幫助我們學習和改進模型。