OpenAI 宣布对 Codex 和语音代理工具进行重大更新-品论天涯网

OpenAI除了每天为数亿用户提供ChatGPT体验外，还致力于为开发者提供AI应用开发平台。OpenAI之所以受到开发者的青睐，不仅因为其尖端的模型，还因为其强大的工具和对开发者的支持。OpenAI今天宣布了两项面向开发者的重要更新。首先是关于OpenAI软件工程代理Codex的。Ive品论天涯网

OpenAI现已向ChatGPTPlus用户开放Codex。在限定时间内，ChatGPTPlus用户将享有慷慨的使用限制，但在高需求时段，OpenAI会对其使用量进行限制。Ive品论天涯网

Codex现在可以连接到互联网来安装依赖项、升级软件包、运行需要外部资源的测试等等。OpenAI指出，互联网访问默认处于关闭状态，但用户可以在特定环境下启用。用户还可以控制Codex可以访问的特定域等等。此Codex互联网访问功能适用于ChatGPTPlus、Pro和Teams用户，企业用户也即将推出。Ive品论天涯网

通过今天的更新，Codex用户现在可以在跟进任务时更新现有的拉取请求。最后，用户现在可以向Codex口述任务。Ive品论天涯网

Ive品论天涯网

除了上述内容和错误修复之外，OpenAI还对Codex进行了以下改进：Ive品论天涯网

增加了对二进制文件的支持：应用补丁时，所有文件操作均受支持。使用PR时，目前仅支持删除或重命名二进制文件。Ive品论天涯网

改进了安装脚本的错误消息。Ive品论天涯网

将任务差异的限制从1MB增加到5MB。Ive品论天涯网

将安装脚本持续时间的限制从5分钟增加到10分钟。Ive品论天涯网

完善的GitHub连接流程。Ive品论天涯网

解决错过通知的问题后，重新启用iOS上的实时活动。Ive品论天涯网

删除了使用SSO或社交登录的用户的强制性双因素身份验证要求。Ive品论天涯网

OpenAI今天的第二个重大更新是关于语音代理的。OpenAI的AgentsSDK现已支持TypeScript，并支持切换、护栏、跟踪、MCP和其他核心代理原语。该SDK还新增了对人机交互审批的支持，允许开发人员暂停工具执行、序列化和存储代理状态、批准或拒绝特定调用以及恢复代理运行。Ive品论天涯网

OpenAI还发布了更新的语音转语音模型，该模型在指令执行可靠性、工具调用一致性和中断行为方面均有所改进。此外，开发者现在可以自定义每次会话的语音语速。开发者现在可以通过RealtimeAPI中的gpt-4o-realtime-preview-2025-06-03和ChatCompletionsAPI中的gpt-4o-audio-preview-2025-06-03访问更新后的模型。Ive品论天涯网

最后，Traces仪表板现在支持实时API会话，允许开发人员轻松地将语音代理运行可视化，包括音频输入/输出、工具调用和中断。Ive品论天涯网