AI 投資的下一步是什麼？

興業證券認為，在垂直場景數據、數據安全、AI 大模型自主可控需求背景下，AI 投資的下一步重點在於 “數據要素 + 國資雲”。

近期，360 董事長周鴻禕談論 AI 時表示：

“算力不是最關鍵的問題，場景和數據是關鍵。有知識量的數據，中文語料佔了不到 5%，大量知識在外文期刊裏面。想要給具體行業賦能，讓 AI 成為某一個領域的專家，就必須使用對應領域的專業數據來訓練。

未來國內各個大廠都會推自己的大模型，微軟、谷歌以及未來國內大廠的模型相當於一個通用模型，大而不精。想要給具體行業賦能，成為某一個領域的專家，就必須使用對應領域的專業數據來訓練。”

興業證券分析師王楠等指出，數據、算法和算力是大模型最重要的三要素。AI 投資除了算力和算法，更要重視數據。

人工智能的根基是訓練，只有通過大量的訓練，神經網絡才能總結正確的規律進行應用。訓練的基礎除了算力和算法，更需要海量的優質數據。

而近期 BloombergGPT 的橫空出世，更為市場展現了根據優質垂直數據 AI 進行訓練的大語言模型的強大之處。該模型依託彭博社的大量金融數據源，構建了一個 3630 億個標籤的數據集，支持金融行業內的各類任務，在執行金融任務上的表現遠超過現有模型，在通用場景上的表現與現有模型也能一較高下。

因此，分析師認為，只有掌握核心行業數據，才能訓練出適用於行業應用的垂直行業大模型。

分析師進一步強調，國資雲掌握的海量優質數據對訓練中國的垂直行業大模型意義重大：

結合近期據發改委官方批露：我國政府數據資源佔全國數據資源的比重超過 3/4，但開放規模不足美國的 10%。個人和企業可以利用的規模更是不及美國的 7%。

以 “國資雲 + 垂直領域模型” 方式，可以確保敏感重點行業原始數據不出域，加速推動行業的智能化轉型升級。而為了保障重點行業數據資源的安全，未來國內大模型的數據存儲和運算，勢必會更大程度使用自主可控的國家隊算力資源。

與此同時，美國加大 AI 相關產業鏈制的裁力度背景下，大模型 “國家級” 平台智源研究院，與中國電子雲、中國移動九天人工智能團隊等兩大央企集團，合作加速推進國產化大模型發展，加速自主可控國產化 AI 大模型發展進程，國內算力自主可控需求迫切。

因此，未來在垂直場景數據、數據安全、AI 大模型自主可控需求背景下，我們認為 AI 投資下一步要重視 “數據要素 + 國資雲”。

總結來看，具備運營、治理政務數據、及重點行業、關鍵垂直領域數據的” 數據要素運營商 “、以及央國企背景的自主可控國資雲廠商，有望迎來價值重估。

本文主要觀點來自興業證券王楠（執業：S0190520120004）等發佈的報告《AI 投資下一步，重視 “數據要素 + 國資雲”》，有刪節