
Surpassing GPT-4 in all aspects! Anthropic has launched its fastest and most powerful AI model, Claude 3, capable of summarizing 150,000 words.

獲得谷歌支持的 AI 初創公司 Anthropic 首次推出 Claude 3 AI 模型,可總結 15 萬單詞,超越 ChatGPT 的 3000 單詞能力。此外,該模型首次支持多模態功能,允許用户上傳圖像和文件。
ChatGPT4 和 Gemini Ultra 被 Claude 3 AI 模型超越了?
3 月 4 日週一,人工智能公司 Anthropic 推出了名為 Claude 3 的 AI 模型和新型聊天機器人,其中包括 Opus、Sonnet 和 Haiku 三種模型,該公司聲稱,這是迄今為止它們開發的最快速、最強大的產品。
Anthropic 公司由前 OpenAI 的研究高管創立。在過去一年裏,該公司成功完成了五輪融資,總額達 73 億美元,並推出了與 OpenAI 的 ChatGPT 直接競爭的產品,獲得了谷歌、Salesforce 和亞馬遜等大型企業的支持,從一個有前景的初創公司成長為在 AI 領域受到業界廣泛關注和支持的熱門企業。
值得一提的是,Claude 3 模型具備處理和總結大量文本數據的強大能力,能夠總結高達 15 萬個英文單詞,相當於長篇大作《白鯨記》或《哈利波特與死亡聖器》的長度。相比之下,OpenAI 的 ChatGPT 只能總結歸納大約 3000 個單詞。此外,Anthropic 還首次允許上傳圖像和文件。
Claude 3 長文本處理能力遠勝 ChatGPT
該公司表示,Claude 3 Opus 是三個模型中最強大的一個,它在處理複雜問題和邏輯推理方面表現卓越,超越了 OpenAI 的 GPT-4 和 Google 的 Gemini Ultra。
其他模型 Sonnet 和 Haiku 在處理能力或功能方面相對有限,但同時也更經濟實惠,因而比 Opus 更便宜,適合那些不需要 Opus 高級功能的用户或企業。
根據 Anthropic 聯合創始人 Daniela Amodei 及 Anthropic 公司的説法,Claude 3 模型存在以下特點:
1)多模態支持和文本處理能力:
- Claude 3 是 Anthropic 首次入了多模態功能的模型,能夠處理和文檔、圖像、視頻等多種數據類型,允許用户上傳圖像和文件,極大地擴展了模型的應用範圍和實用性,使其成為行業內最受關注的應用之一。
- Claude 3 模型能夠總結高達 15 萬個英文單詞,遠超過 OpenAI 的 ChatGPT 的 3000 個單詞,此外,Claude 3 還能夠根據用户的需求提供不同格式的輸出,如備忘錄、信件或故事等,這一能力使得 Claude 3 在處理長篇文本方面遠超過 OpenAI 的 ChatGPT。
- Claude 3 對用户意圖和上下文的理解更加細膩,它能通過深入分析語言的語義、語境和情感等方面,提供更準確和相關的回應。
2)風險理解能力的提升:
- Anthropic 聯合創始人 Daniela Amodei 表示,新推出的 Claude 3 模型在理解敏感或爭議話題的風險方面較前一版本有所提升,能更準確地判斷何時回應或保持謹慎。以往的 Claude 2 模型在處理敏感話題時過於保守,有時會過度拒絕回應敏感或有爭議的話題,而 Claude 3 致力於在在保持安全和謹慎的同時,致力於減少不必要的回應限制,使模型更靈活實用。
具體發佈時間方面,Anthropic 稱,Sonnet 和 Opus 已從週一起在 159 個國家/地區推出,而 Haiku 也將很快推出。
團隊方面,Amodei 透露,公司在開發核心 AI 模型時採用了分層的團隊結構。核心開發團隊由 60 到 80 人組成,負責模型的算法和架構設計。技術支持團隊則有 120 到 150 人,負責編程、數據處理、測試和部署等工作。
在模型的最後迭代中,直接參與開發的人數為 30 到 35 人,但整體支持團隊達到了約 150 人。雖然直接參與核心開發的團隊規模相對較小,但整個項目的支持團隊規模較大,這種團隊配置確保了模型開發的高效協作和優化。
僅文本不夠,AI 模型需多模態功能
在過去一年中,生成式 AI 成為商業和技術界的焦點話題,並迅速滲透到多個領域,包括教育、在線旅遊、醫療行業和在線廣告等,各大企業財報電話會議中也反覆出現 AI 話題。
根據 PitchBook 數據,2023 年 AI 領域的投資額達到了創紀錄的 291 億美元,交易量同比增長超過 260%,顯示出投資者對 AI 發展潛力的強烈信心。
AI 迅速發展的同時,OpenAI 首席運營官 Brad Lightcap 指出,僅將文本和代碼作為 AI 模型的輸入和輸出是不夠的,AI 應該更接近於人類的自然感知和交互方式,他説道:
“世界是多模態的,人類的日常體驗不僅包括文本,還涉及圖像、聲音等多種感覺輸入。因此,僅將文本和代碼作為人工智能模型的輸入和輸出是不夠的。”
“為了讓 AI 模型更好地模仿人類的感知和交互方式,它們需要能夠處理和生成多種類型的數據。通過整合多種模態,人工智能模型可以提供更豐富、更真實的體驗和應用,更接近於人類的自然感知和交互方式。”
然而,隨着 AI 模型日益複雜化,尤其是在引入多模態功能如圖像生成後,新的風險和挑戰也隨之而來。例如,谷歌最近因用户發現其 AI 圖像生成器(Gemini 聊天機器人的一部分)的歷史不準確和有問題的回應而將其下線,這一事件在社交媒體上引起了廣泛關注。
與 Google 的 Gemini 不同,Anthropic 的 Claude 3 不具備生成圖像的能力,它只允許用户上傳圖像和其他文檔進行分析,從而在一定程度上減少了由自動生成內容引發的風險和爭議。
Amodei 也承認:
“當然,沒有任何模型是完美的,我認為提前説清楚這一點非常重要。在開發模型時,我們不僅追求模型的性能和功能,也同樣重視模型的安全性和可靠性。當然,儘管進行了嚴格的開發和測試,模型偶爾會犯錯,並在某些情況下產生不準確或不可預測的輸出。”
