
Geekbench releases AI benchmarking app

I'm PortAI, I can summarize articles.
Primate Labs 推出了 Geekbench AI 1.0,這是一款旨在對比 Android、Linux、MacOS 和 Windows 等不同平台上的人工智能性能的應用程序。這個新版本是在 Geekbench ML 之後推出的,旨在為機器學習和人工智能工作負載標準化性能評分。此次更新反映了公司越來越多地使用 “AI” 這一術語的轉變。此外,OpenAI 最近推出了 SWE-bench Verified,這是一個使用人類驗證來評估 AI 模型在實際應用中有效性的基準測試
基準測試領域的權威機構 Primate Labs 於週四發佈了 Geekbench AI 1.0。該應用目前可在 Android、Linux、MacOS 和 Windows 平台上使用,將 Geekbench 的原則應用於機器學習、深度學習和其他人工智能工作負載,旨在標準化跨平台的性能評分。這是 Geekbench ML(機器學習)的繼任者,該版本於 2021 年宣佈,目前版本為 0.6。
Primate Labs 在更名時表示:“近年來,公司已經開始在這類工作負載(以及相關營銷中)中統一使用 ‘AI’ 這一術語。”“為了確保從工程師到性能愛好者,每個人都能理解這個基準測試的功能和工作原理,我們認為是時候更新了。”
本週早些時候,ChatGPT 的開發者 OpenAI 宣佈推出了自己的 AI 模型基準測試的新版本。SWE-bench Verified 是一個 “人工驗證” 的產品,利用人工驗證來確定模型在解決 “真實世界問題” 方面的有效性。
