Codex此次进行了重大更新,从单纯的代码编写工具转变为能操作电脑的助手。过去它作为编码工具,边界清晰,用户提出需求,它生成代码。如今,其边界被大大扩展,它能操作电脑、使用应用、在不同工具间切换,还可将任务留到几天后继续,并根据用户习惯给出下一步建议。
此次更新的核心亮点是Codex开始直接操作电脑,通过“看到屏幕、点击鼠标、输入键盘”的方式使用电脑应用,绕过API接口限制,直接在界面上动手,且不打断用户当前工作,多个Agent可在后台并行运行。该功能目前在macOS抢先上线。
此外,这一版本的Codex开始直接接入网页,用户可在页面上圈出区域、写下评论,将“位置”变成指令,对前端设计和游戏开发非常有用。官方还计划扩展其对浏览器的控制能力。
Codex添加了原生图像生成功能,可使用gpt - image - 1.5生成和迭代图像。围绕开发流程,它补上了很多分散环节,如处理GitHub评审评论、打开多个终端标签、连接远程开发环境、预览文件等,还有汇总面板展示工作信息。
它还扩展了插件和工具集成,接入90多个插件,任务可跨工具流动。同时,Codex能把任务“留到以后再做”,复用上下文,具备记忆能力,贴合用户工作方式,给出行动建议。
在市场竞争中,Codex与OpenClaw方向一致,都是让AI完成任务,但OpenClaw更偏“调用工具”,而Codex将AI放进系统内部直接操作应用。Perplexity AI发布的“Personal Computer”Mac桌面应用,以及Anthropic的产品也在尝试让AI整合本地环境和执行任务,但各有侧重。国内大厂也在布局类似Agent体系。
Codex正在从写代码工具变成跨应用、跨时间持续完成任务的系统,朝着“超级应用”方向发展。未来,它面临着如何进一步优化功能、适应更多系统和用户需求的挑战。但一旦成功,将为用户带来更高效、便捷的工作体验,其商业化前景也十分广阔。
编辑观点:Codex此次更新意义重大,拓展功能并整合工作流,虽面临竞争和适配挑战,但有望成“超级应用”,引领AI工作方式变革。