OpenAI除了每天为数亿用户提供ChatGPT体验外,还致力于为开发者提供AI应用开发平台。OpenAI之所以受到开发者的青睐,不仅因为其尖端的模型,还因为其强大的工具和对开发者的支持。OpenAI今天宣布了两项面向开发者的重要更新。首先是关于OpenAI软件工程代理Codex的。
OpenAI现已向ChatGPTPlus用户开放Codex。在限定时间内,ChatGPTPlus用户将享有慷慨的使用限制,但在高需求时段,OpenAI会对其使用量进行限制。
Codex现在可以连接到互联网来安装依赖项、升级软件包、运行需要外部资源的测试等等。OpenAI指出,互联网访问默认处于关闭状态,但用户可以在特定环境下启用。用户还可以控制Codex可以访问的特定域等等。此Codex互联网访问功能适用于ChatGPTPlus、Pro和Teams用户,企业用户也即将推出。
通过今天的更新,Codex用户现在可以在跟进任务时更新现有的拉取请求。最后,用户现在可以向Codex口述任务。
除了上述内容和错误修复之外,OpenAI还对Codex进行了以下改进:
增加了对二进制文件的支持:应用补丁时,所有文件操作均受支持。使用PR时,目前仅支持删除或重命名二进制文件。
改进了安装脚本的错误消息。
将任务差异的限制从1MB增加到5MB。
将安装脚本持续时间的限制从5分钟增加到10分钟。
完善的GitHub连接流程。
解决错过通知的问题后,重新启用iOS上的实时活动。
删除了使用SSO或社交登录的用户的强制性双因素身份验证要求。
OpenAI今天的第二个重大更新是关于语音代理的。OpenAI的AgentsSDK现已支持TypeScript,并支持切换、护栏、跟踪、MCP和其他核心代理原语。该SDK还新增了对人机交互审批的支持,允许开发人员暂停工具执行、序列化和存储代理状态、批准或拒绝特定调用以及恢复代理运行。
OpenAI还发布了更新的语音转语音模型,该模型在指令执行可靠性、工具调用一致性和中断行为方面均有所改进。此外,开发者现在可以自定义每次会话的语音语速。开发者现在可以通过RealtimeAPI中的gpt-4o-realtime-preview-2025-06-03和ChatCompletionsAPI中的gpt-4o-audio-preview-2025-06-03访问更新后的模型。
最后,Traces仪表板现在支持实时API会话,允许开发人员轻松地将语音代理运行可视化,包括音频输入/输出、工具调用和中断。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】