
The arrival of a B-end artifact? Microsoft releases SpreadsheetLLM, which can significantly enhance AI capabilities in Excel

Microsoft 發佈全新的 AI 大語言模型 SpreadsheetLLM,將廣泛使用於理解並處理複雜的電子表格數據,如在 Excel、谷歌 Sheets 中自動生成財務報告、識別數據中的異常或趨勢、提供個性化產品或服務推薦等。網友調侃:“凱倫的工作很快就會被人工智能取代”。
12 日,Microsoft 發佈了一個新的大型語言模型,計劃為 Excel、谷歌 Sheets 等電子表格應用程序開發全新的 AI 大語言模型--SpreadsheetLLM。
Microsoft 在論文指出,SpreadsheetLLM 作為一款全新的 AI 模型,將廣泛使用於理解並處理複雜的電子表格數據。
SpreadsheetLLM 具有改變電子表格數據管理和分析的潛力,為更智能和高效的用户交互鋪平了道路。
這或許會讓會計師和數據分析師們對他們的未來工作前景感到擔憂。網友們在社交平台 X 上調侃,認為 “凱倫的工作很快就會被人工智能取代”。
“凱倫可能很快就會失業”
研究人員指出,當前的電子表格應用程序功能豐富,在佈局和格式方面為用户提供了大量選擇,這使得傳統的 AI 大語言模型難以在電子表格處理方面發揮作用。而 SpreadsheetLLM 就是專門為電子表格應用而設計的 AI 模型。
微軟還開發了 SheetCompressor(壓縮電子表格)工具,以幫助 SpreadsheetLLM 更好地理解和處理電子表格數據。

研究人員稱,SpreadsheetLLM 的潛在應用非常廣泛,從自動執行日常數據分析任務,到提供基於電子表格數據的智能見解和建議。例如,SpreadsheetLLM 可用於自動生成財務報告、識別數據中的異常或趨勢、為客户提供個性化的產品或服務推薦等。
因此,SpreadsheetLLM 有可能徹底改變企業處理數據的方式。
一位用户聲稱:“正如我們所知,能夠編寫 SQL 的 LLM 將扼殺整個數據工程行業。”

另一位寫道,“SaaS 陷入了深深的麻煩。”

“這對金融界來説將產生巨大影響”

賓夕法尼亞大學沃頓商學院副教授伊桑·莫利克(Ethan Mollick)在推特上寫道:“這再次表明 LLM 很快就能處理結構化和非結構化電子表格數據。這將解鎖許多用例(預測、財務、估值等),並且擁有電子表格真實來源往往會減少幻覺。”

SpreadsheetLLM 如何工作?
SpreadsheetLLM 通過將電子表格數據編碼為大型語言模型(LLM)可以理解的格式,從而使 LLM 能夠對電子表格數據進行推理、回答有關數據的問題,甚至根據自然語言提示生成新的電子表格。
SpreadsheetLLM 的核心是 “SheetCompressor” 框架,該框架可以有效地壓縮和編碼電子表格數據,使其更易於 LLM 處理。SheetCompressor 由三個模塊組成:
▲基於結構錨點的壓縮:在整個電子表格中放置 “結構錨點”,以幫助 LLM 理解數據結構。
▲逆索引翻譯:將電子表格轉換為更緊湊的格式,並消除冗餘數據。
▲數據格式感知聚合:根據數字格式和數據類型對相鄰單元格進行分組。

SHEETCOMPRESSOR 框架的插圖(圖片:Microsoft)
Microsoft 稱,SpreadsheetLLM 顯着提高了電子表格檢測任務的性能,在 GPT4 的上下文學習設置中比普通方法高出 25.6%,使用詞元(token)的成本降低了 96%,並能提供更好的處理結果。
目前,Microsoft 還沒有公佈何時向公眾發佈 SpreadsheetLLM 的消息。該論文指出,該模型仍有一些限制,如對於複雜或結構化程度高的數據,其理解能力仍然有限;SheetCompressor 目前還不能壓縮包含自然語言的單元格等等。
