Chatgpt 淘汰搜索？中信不信！

中信證券認為，ChatGPT 很難取代傳統搜索引擎，甚至無法撼動當前全球搜索引擎市場競爭格局。

就在上週，谷歌 23 號員工 Paul Buchheit 表示，像 ChatGPT 這樣的人工智能聊天機器人將像搜索引擎殺死黃頁一樣摧毀谷歌。

面對 ChatGPT 的威脅，谷歌已經緊張起來了。上週五，谷歌母公司 Alphabet CEO 桑達爾·皮查伊谷歌將在 “未來幾周或幾個月” 推出類似 ChatGPT、基於人工智能的大型語言模型。

曾經的屠龍者，如今要成為被屠的巨龍了嗎？

中信證券分析師陳俊雲等認為，ChatGPT 要想取代傳統搜索引擎，還早得很，類似的人工智能聊天機器人，甚至都無法撼動當前全球搜索引擎市場競爭格局，但可以推動相關技術加速落地。

中短期內很難取代傳統搜索引擎

分析師在試用 ChatGPT 時發現，相較於傳統搜索引擎提供內容相關頁面鏈接，ChatGPT 可以直接生成面向問題的高完成度回答，並能夠提供回答內容的相關引用鏈接（目前測試版本尚未開發這一功能）。此外針對開放式問題，ChatGPT 也可以通過匹配網絡中的數據生成較為完整的答案，在處理知識類以及創意類的問題時，ChatGPT 提供的搜索體驗遠勝於目前的傳統搜索引擎。

但是，分析師認為，ChatGPT 目前還存在三個致命的不足之處：

1) 數據的實時性問題。目前英文版本的 ChatGPT 數據截至 2021 年，而中文版本的 ChatGPT 數據截至 2020 年，數據庫版本滯後的主要原因是由於語言類大模型的技術限制。ChatGPT 目前的在 GPT 大模型上加入標註數據訓練模式讓實時數據的引入非常困難，如果要重新預訓練模型，我們估計每次預訓練需要用到 1000 塊以上的英偉達 A100 顯卡工作半個月至一個月的時間，成本在百萬美元以上。而如果採用使用微調的方式專門訓練新知識，會導致新知識的在模型內的權重過高，頻繁的微調也會導致模型 “遺忘” 舊的知識。

2）數據的真實性仍不足可靠。在大量的測試後我們發現，雖然 ChatGPT 回答問題的準確性有所提高，但如果提出的問題較為模糊或者本身包含部分錯誤信息在內，模型有可能以 “一本正經” 的語氣生成完全錯誤甚至憑空捏造的回答。真假答案的混雜會讓用户在需要對專業性問題尋求答案時產生嚴重的困擾，這也是目前語言類大模型普遍存在的問題。據 CSDN 微信公眾號報道，2022 年 11 月幾乎同一時間上線的 Meta 服務科研領域的語言類大模型 Galactica 就因為真假答案混雜的問題，測試僅僅 3 天就被用户投訴下線。

3）模型在線推理端成本高昂。根據模型的現有數據，我們假設每次生成的回答長度平均為 50 個詞，使用 8x 英偉達 A100 用於推理的情況下，我們估算 ChatGPT 每一次生成答案的成本約為 1.3 美分，約為谷歌搜索引擎每次搜索成本的 3 倍。如果每天面對數以億計用户的搜索請求，如此高昂的成本是公司所不能承受的，中短期內完全取代傳統搜索引擎在商業模式上無法做到。

難以撼動現有搜索市場格局，但可以推動相關技術加速落地

除了 ChatGPT 背後的 OpenAI，谷歌、百度等搜索大廠均在大語言模型上有深厚的積累，尤其是谷歌，其部分技術還要在 ChatGPT 之上。

隨着谷歌計劃將類似的 AI 聊天機器人融入搜索引擎中，中信預計 ChatGPT 的成功不會給搜索產業帶來顛覆性的新入局者。但 ChatGPT 的攪局，足以在搜索引擎中掀起 “軍備競賽”，加速大語言模型相關技術的迭代。

分析師指出，目前的搜索引擎巨頭可以藉助 ChatGPT 的功能，來優化搜索時的用户體驗，主要有三個方向：

1）考慮到 ChatGPT 在不同分類問題中的表現情況，限制 ChatGPT 搜索僅在知識類搜索場景下啓用可以有效控制成本。

2）面對時效類問題時，模型自動判斷轉向傳統搜索引擎生成答案，並通過傳統搜索引擎的數據返回生成 ChatGPT 版本的匯總新答案。

3）針對回答真實性問題，加入對答案產生來源的引用註明給用户，讓用户可以快速檢驗回答的可靠性。