做 “APP” 才是未來 AI 公司的出路?

華爾街見聞
2023.04.05 02:06
portai
I'm PortAI, I can summarize articles.

通用語言大模型如智能手機時代中的 iOS、安卓,也就類似於智能時代只需要兩、三個手機系統足矣,在 AI 的全新時代裏,也只需要幾個通用語言大模型。對垂直領域的 AI 公司而言,機遇並不在於趕不趕得上 ChatGPT 這輛車,而是在通用語言大模型下,如何做出微信、抖音、淘寶……

作者 | 胡描 編輯 | 羅麗娟

“AI 改變世界” 似乎正在被 ChatGPT 實踐,其強大的自然語言處理能力改變着各行各業,帶來更多可能性。

但鉅變也帶來了焦慮和不安。在近期,美國非營利組織未來生命研究所發佈了一封 “暫停巨型 AI 實驗” 的公開信。包括埃隆·馬斯克在內的上千名人工智能專家、行業高管在信中呼籲:所有人工智能實驗室暫停半年對更強大的人工智能系統的開發和訓練。

“人工智能大模型已經是一個既成事實,誰聯名説反對都阻擋不了這件事情會跟我們共存。 ” 氪信科技 CEO、粵港澳大灣區數字經濟研究院計算金融 CTO 工作室負責人朱明傑告訴全天候科技,“我們要考慮的是智能的能力突破了使用的閾值以後,我們的社會和行業會如何去改變。”

在 2015 年,朱明傑創立了氪信科技。這是一家將搜索引擎的機器學習技術用於金融領域的人工智能公司,為金融機構提供智能風控、智能營銷、智能客服、異常交易監測等服務。

在企業剛成立時,投資人問朱明傑公司做的是什麼,他解釋了許多次:“賣模型”,模型即服務 MaaS(Model as a Service),能夠解決客户的問題,客户並願意為此付錢訂閲。“説得抽象一點,就是把人類的智慧教給計算機模型,它能複用給你服務。” 但都很難被人理解。

“今年 OpenAI 的 ChatGPT 幫我們很大的忙,我不用解釋很多了。” 朱明傑説。

ChatGPT 的出現,給整個 AI 行業帶來了機會,同時也在重塑 AI 行業的結構。

朱明傑認為,AI 大模型是一個基礎設施,可以理解智能手機時代中的手機系統,如 IOS、安卓。AI 行業不需要太多的” 系統 “,但需要許多的 “APP”。對於 AI 公司而言,機會出現在應用側,如何在一個垂直領域中把模型做好,做得更專業才是關鍵。

在如今,通用語言大模型已經證明了 AI 處理自然語言的能力,但距離可信的專業大模型還有一定的距離。作為一個金融領域的 AI 企業,讓一個通用型 AI 成為一個金融領域專家,這是目前朱明傑團隊正在解決的難題。

對於 AI 大模型的研發壁壘,創業型 AI 公司的機會,通用語言大模型與專業模型的關係,如何打造專業的金融語言模型等問題,媒體與朱明傑進行了一場交流。

以下為對話內容,經全天候科技整理:

氪信科技 CEO、粵港澳大灣區數字經濟研究院計算金融 CTO 工作室負責人朱明傑

01 “最難解決的是數據問題”

Q:最近看到了馬斯克等科技人士聯名呼籲暫停研發更強大的 AI,你怎麼看待這個事情?

朱明傑:人工智能大模型已經是一個既成事實,誰聯名説反對都阻擋不了這件事情會跟我們共存。我們要考慮的是智能的能力突破了使用的閾值以後,我們的社會和行業會如何去改變。

我們今天日常生活看新聞,玩抖音,用電商,都是基於 20 多年前的搜索革命。第一次搜索讓你主動查得信息,搜索接下來帶來推薦,我們的日常生活被這個技術改變了。ChatGPT 之後,你不用自己去辨別信息,你只要提出問題,它把答案全給你了,帶來了完全不一樣的東西。

GPT模型的核心是預測,AI 具備預測能力,因為它學習了過去人類所有的信息,及互聯網的數據,彙集了人類的智慧。它能夠基於此預測下面最有可能的發生的事情,所以很嚇人。

OpenAI 的突破本質上第一次用了上萬張 A100 的卡,並搭載巨大數據量,由 100 個年輕的沒有包袱的研究員團隊做到的。簡單來説,做成這件事要有算力的基礎,要有團隊的基礎,要有數據的基礎。

Q:目前在 AI 大模型的研發中,大家經常談到算力的問題,算力是最大的阻礙嗎?

朱明傑:我們可以思考一下大模型的規模集訓在哪裏。黃仁勳他説過,他下面新的產品算力會有 50 倍的提升,算力一下子突破,原來擔心的那些規模問題可能就不是問題。最後它商業上有用一定會變得成本完全可控。

今天 ChatGPT 已經證明了它巨大的商業價值,這個很像人類進入集成電路時代,最早開始搭建晶體管、電子管這些東西,這也導致最早計算機巨大無比,後來大家把這個東西封裝到一個晶片上面,在晶片上把一些邏輯層封進去。

GPT 大模型和它很像,把人類的知識封裝到這裏面去。巨大的訓練和推理背後需要很大的算力做支撐,都是有這些消耗在裏面。恰恰因為半導體晶片做了芯片以後,這個東西發揮了巨大價值。有這麼大的需求,就一定會以足夠低的代價讓大家用到。

本質上 OpenAI 解決的問題是如何把這麼大的數據壓縮到模型裏面去,變成知識,這是它的終極目標。中間算力到底用 A100 還是 A800,用了這個 GPU 架構還是 CPU 架構,這些反而都是可解的事情。只是因為我們買不到 A100,變成卡脖子,讓所有人第一個反應這個問題很重要,沒有想到這個問題是為了什麼。

Q:那你認為最大的難點是什麼呢?

朱明傑:核心是你能不能拿到那些有價值的數據。所以最難解決的是數據問題,因此現在凡是巨頭有這個條件都會全力幹這個事。

10 億美金起步價僅限於做通用的大模型這件事。垂直領域上不是錢的問題,是能不能獲得那個領域上的數據,這個事情怎麼幹的,這寫是要評估的。沒幹過這件事,閉上眼睛説訓練大模型,這個不可能的,比通用大模型更難。

通用大模型是暴力出奇跡,砸錢按這個方法能做出來。這是一個新的時代,不缺奇蹟的出現,對大家來説都有緊迫感。懷着悲觀的心情在做樂觀的事。

02 “大模型關上了很多門,有點像《三體》裏面物理學不存在”

Q:當前有很多科技公司、互聯網公司、行業大佬下場做大模型,你認為誰更可能跑出來?

朱明傑:大模型是一個基礎設施,可以理解成 IOS 和安卓系統。這件事情本質上不會有很多人能做成,也不應該有很多人去做,就一兩家最後做這個事情。你今天會在意你的手機到底是安卓、IOS,還是鴻蒙系統?這些不重要,關鍵是這上面有沒有微信、小紅書、淘寶……

美國在 OpenAI 之後,可能再出現一家,之後第三方初創公司的機會會很小,因為大家都不需要了。中國也會有一兩家。

需要注意的是,ChatGPT 是 OpenAI 做出來的,不是微軟、GOOGLE、Facebook 做出來的,他們是非常年輕的精英團隊。做成這件事情真不是説要多知名的人來幹,更多是一羣優秀的年輕人。但也不能太多大,人類的協作不能超過規模,超過規模反而效率降低。

坦白來説,不管是國內還是國外,他們今天做這件事,今天能跟上 OpenAI 的尾燈就很不錯。花三年的時間做出來一個跟得上別人東西的東西,這個難度遠遠超過我們的想象。

OpenAI 如果沒有成功,你們都不知道有這麼一撥人。我現在對大模型的觀點,需要靠時間去檢驗。也許兩年以後我們再回頭看,大家會想沒想到當初是他做出來的。這個東西不是能夠計劃出來的,有太多的變量變數在裏面。

2017 年,朱明傑等人訪問 Open AI 時的照片,講話人為創始人山姆·阿爾特曼 照片拍攝:朱明傑

Q:AI 大模型的出現,對 AI 公司尤其做應用的 AI 公司來説,到底是機會還是威脅?

朱明傑:首先大模型關上了很多門,有點像《三體》裏面物理學不存在。很多同行用大半生的心血做自然語言處理的具體工作,類似對話、翻譯以及文本的輔助生成。但 ChatGPT 的出現導致這些工作沒有價值了,很多公司做的事情不需要了。

但是 AI 的能力強到這個程度以後,就開始變成了基礎設施。它就好比電,大家都看不到摸不着這些東西,但可以通過通用電氣、飛利浦、西門子,甚至戴森、小米等公司的產品去感受它。簡單來説,未來 AI 公司其實就是產品公司。

在我看來,中國很有必要做大模型。但不應該所有的人都去做,能做出來極少數那麼一兩家,剩下來的可以做飛利浦、西門子。所以對 AI 公司來説,未來有很大的窗口機會。

Q:你認為做應用的 AI 公司應該往哪個方向探索?

朱明傑:既然 iOS 已經出來了,現在就是市場被倒逼,我關心的是我們做出什麼樣的 APP 應用來解決它們的問題。

這裏面兩個挑戰,一個怎麼把行業的數據融合進去。比如我做金融,金融知識、專家經驗及場景三個數據到底怎麼去融合到一個能夠幫人解決問題的金融模型裏面去,做到可靠、可信。

另外,這個東西怎麼去改造它的業務場景,這個對已經做了一些年的公司來説,既有挑戰也有機遇,總體還是偏機會的一個事情。你的技術要與時俱進,跟新的工具整合,原來用的那套東西要升級。另一方面更大的事情,你長期在這個場景上,你瞭解這個場景的數據。

很薄的應用、功能點的應用不要去做了。比如前段時間很多人説多模態的事情,從文本到圖到視頻這些東西,既然單一的文本模態這件事情已經解決得很好了,我是不是彎道超車。問題是 4.0 出來多模態合作,就不需要了。

包括原來很多人想根據 ChatGPT 跟 Office 做一些整合,這種事情不用做了,本身就是微軟的場景。有了新的 AI 大模型以後,得場景者得天下。

03 “垂直領域需要更高維的 AI 模型”

Q:氪信做的是金融行業的 AI 模型,應用到哪些方面?做金融行業的 AI 是否有風險呢?

朱明傑:我們這個公司一直在為金融行業服務,以前 AI 的門檻太高了,導致只有極少數頭部的,有能力的,和有足夠數據量的金融機構才願意來嘗試這個事情。

我們不是來講故事的,要真的幫他解決問題,比如用人工智能幫人家做金融風險評估,不是靠人的規則來弄,因為人的規則容易被破解,需要更高維的 AI 模型來做這個事情。

比如交易風險的檢測,銀行每天有上億筆交易,人沒辦法一筆筆審核。雖然專家很準,但我們沒有那麼多專家,培養一個專家就很難,可能 20 年經驗。我們做的事情,用金融這些數據和金融專家經驗去訓練 AI 模型,再讓 AI 模型去自動跑,從而擁有更多 “專家”。

金融行業繞不開兩個問題,一個合規問題,一個是專業性問題。今天語言模型是胡説八道的,還沒有人能夠解決專業性問題。對金融機構來説,這是很危險的事情,如果出現問題會有一系列後果,也很難解決。

今天大家對大模型可用性和價值沒有疑問了。接下來則是你落地到各個行業以後要解決的問題,如何讓它變得可信。除了金融領域,還有醫療、教育等領域,都不可以胡説八道。

Q:你提到 “準確” 這件事情,現在讓生成式 AI 做到這件事情幾乎不可能,你們是怎麼解決的?

朱明傑:這件事情相當於 ChatGPT 在內容生成上面做了一個單點突破,先證明我有這個寫作能力,但可能是錯的。接下來大家都在想各種辦法訓練出垂直領域上的可信模型出來。

這件事理論上可行,但實際操作有一些困難。因為目前包括中美等國家,很多行業大量的數據是不連通的,有的是在行業內部特有的,更往下一層在企業內部還有。比如中國銀行所有的外匯交易信息、票據信息、債券信息,這些不可能跟別人共享。

我們在裏面的實現路徑要把三類知識裝進去。

第一類是金融的領域知識,我們會跟銀行合作。第二類,金融模型在不斷學習相關領域所發生的場景,比如哪些人信貸違約,交易裏面哪些人是騙子,營銷過程中的用户行為。第三類就是把專家的經驗整合到 Credit AI 模型裏面去。

我們做的金融賬户安全大模型目前形成了以億為量級的模型,這個模型放到今天來講是小模型,但對金融行業是大模型。這裏面有大量金融專家的標註在裏面,也有過去很多實際損失發生得來的教訓。我把這個模型部署到一個銀行,就能提前預測三天到兩個月之內會出問題的賬户。

Q:已經有實踐了嗎?效果如何呢?

朱明傑:最初大家不相信,我們就把預測的模型部署到客户那邊,每天訓練並預測你下面三天到兩個月之內會有哪些賬户變成壞人,但先不處理。等到月底的時候,公安會把所有的東西匯總,驗證這些賬户是否真的有問題。

有一家銀行測試了一個月,到了月底發現出問題的賬户裏面超過七成的賬户都是被提前預測的。

有人問我一個問題,你們用了什麼規則?用了什麼特徵找到這些事情?我無法解釋,這是我們的大模型預測出來的。但是你看它們預測出來找到的這些有問題的嫌疑對象,肯定是有問題的。他們的專家看了以後發現真是有問題。

AI幫專家做了一個大海撈針的事情,撈到的針,專家一看是針,他明白這個事情,但是沒有精力天天 24 小時去看,我們相當於提供了一個機器人幫他來去監控這些事情。

Q:對金融行業來説,垂直 AI 大模型的出現,會改變這個行業的那些方面?

朱明傑:我來形容一下我們今天在金融行業做的 Credit AI 模型有和沒有的區別。

沒有的時候,一個銀行可能幾十萬上百萬的員工幾萬個網點,這裏面靠大家的管理培訓來做一些操作,來識別風險,這裏面肯定是參差不齊的,只能靠總行來幾個專家不停給他們培訓提升水平。

今天我們有了 Credit AI 模型,已經把專家的經驗灌到裏面去,只要少數幾個專家就可以完成大部分的事情。

但是這個東西不斷迭代,犧牲的是普通人,在專業的領域裏面依然需要專家的反饋。比如我在金融領域我的 Credit AI 模型很大程度依賴的是來自於專家的輸入反饋,他覺得這個不對,這個 case 模型處理錯了,就要迭代到模型裏面去。

我在金融行業裏面,今天很多人覺得會被改變掉。比如財富管理,在傳統模式下,大家買基金或者買保險可能找朋友找顧問聊聊,知道這件事情很可信,最終解決信任的問題。但人的精力終究有限,不能一天給一百個人每人講一個小時。通用人工智能完全可以把你的價值觀和產品灌輸到裏面去,可以做一個專屬的替代產品的入口級應用。

這件事情一定會發生,未來可能塑造像 “梁朝偉”、“劉德華” 這樣形象的超級數字人去服務幾百萬粉絲。