
OpenAI is completely surpassed: Claude is making great strides, and new features are coming again

OpenAI 最近推出了 Claude 3.5 Sonnet 驅動的提示生成器,使編寫高質量的提示變得更簡單。用户可以在 Anthropic Console 中生成、測試和評估提示,並利用新功能自動生成測試用例和比較輸出。這些功能能夠幫助用户優化提示並生成最佳響應,加快開發速度並提升結果。現在,用户可以輕鬆創建高質量提示,並在將其部署到生產環境之前進行測試和評估。這些新功能對於構建 AI 驅動的應用程序非常有幫助。
在構建 AI 驅動的應用程序時,提示(prompt)的質量對結果有重大影響。然而,編寫高質量的提示具有挑戰性,需要深入瞭解應用程序需求以及大語言模型(LLM)。為了加快開發速度並提升結果,Claude 簡化了這個過程,使用户能夠更輕鬆地創建高質量提示。
現在,你可以在 Anthropic Console 中生成、測試和評估你的提示。Claude 增加了新功能,包括自動生成測試用例和比較輸出的功能,讓你能夠利用 Claude 生成最佳響應。
生成提示
編寫一個好的提示就像向 Claude 描述任務一樣簡單。Console 內置了一個提示生成器,由 Claude 3.5 Sonnet 驅動。你只需描述任務(例如 “分類處理客户支持請求”),Claude 就會為你生成一個高質量的提示。

你可以使用 Claude 的新功能生成測試用例,為提示提供輸入變量,例如客户支持消息,並運行提示查看 Claude 的響應。或者,你也可以手動輸入測試用例。

生成測試套件
通過將提示與一系列真實世界的輸入進行測試,你可以在將提示部署到生產環境之前,對其質量有更高的信心。使用新的評估功能,你可以直接在 Console 中進行此操作,而無需手動在電子表格或代碼中管理測試。
手動添加或從 CSV 文件導入新的測試用例,或者使用 “生成測試用例” 功能讓 Claude 自動生成。根據需要修改測試用例,然後一鍵運行所有測試。查看並調整 Claude 對每個變量生成要求的理解,以便更精細地控制生成的測試用例。

評估模型響應並迭代提示
現在,優化提示變得更加簡便,你可以創建提示的新版本並重新運行測試套件,以快速迭代和改進結果。Claude 還增加了並排比較多個提示輸出的功能。
你甚至可以讓專家對響應質量進行 5 分制評分,以評估更改是否提高了響應質量。這些功能使改進模型性能的過程更加快捷和易於訪問。
測試用例生成和輸出比較功能對所有 Anthropic Console 用户開放。
除此而外,Claude 另外一個重磅功能也來了
Artifacts 分享
真正的技術平權,每個人都可以用 AI 編寫代碼生成和發佈自己的內容,也可以在別人的基礎上修改,現在你可以分享 Claude 的 Artifacts 了(分享你的作品),別人也可以修改 Artifacts。

本文作者:AI 寒武紀,來源:AI 寒武紀,原文標題:《OpenAI 被全面超越:Claude 高歌猛進,新的功能又來了》
