美国的人工智能(AI)公司Anthropic确认已在内部扩展其语言模型“Claude”的开发者工具“Workbench”功能。Claude Workbench是一个为开发者设计的工具,帮助他们轻松进行API的测试和设置。
此次功能扩展是通过专门处理新AI功能和测试目录的TestingCatalog最近确认的。除了Claude,TestingCatalog还探索了GPT与Gemini等生成型AI的最新变化,并定期监控开发者专有功能。
根据TestingCatalog的消息,Workbench添加了一个名为“API Playground”的新功能。该功能允许用户无需编写代码即能对Claude API的各种设置进行试验。用户可以在网络界面中直接调整响应温度、缓存设置和自定义标题等。

对于即将进行API集成的开发者或产品团队而言,此功能可以简化反复测试和参数调整的过程,其应用潜力巨大。但目前尚未正式发布,仅在“预览”状态下有限启用。
Workbench中的“分析”标签下也正在试验一种能视觉化查看“Claude Code”工具活动记录的功能。Claude Code是在命令行环境中生成代码,并将其直接提交到版本管理系统的工具。

Workbench新增的分析功能通过显示提交次数等方式,展示了Claude Code在项目中的贡献程度。这可以作为企业或开发组织客观测量AI实际项目贡献代码量的标准。但分析标准和具体测量方式尚未公开。
TestingCatalog还确认Workbench新增了一个名为“产品评估(Product Evals)”的部分。目前仅显示“即将推出”,具体功能尚未透露。不过从功能名称来看,可能会包括如提示响应质量评估或模型比较测试等实验工具。

这些扩展功能目前仅在美国和有限地区的非公开版本中进行实验,尚未对包括韩国在内的一般用户公开。Anthropic对于这些功能的正式发布时间或地区计划暂无官方表态。
此次功能扩展被解读为是为了将AI工具从聊天机器人功能扩展到实际开发和运营环境的一部分。就像OpenAI逐步开放以ChatGPT为中心的多种开发者功能一样,Anthropic也在将Claude生态系统优化为技术基础组织的工具。
一旦Workbench功能正式发布,Claude将不仅仅是一个简单的对话型AI,而可能成为在实际工作、代码编写和产品开发全过程中得以应用的综合工具。