,

OpenAI 推出 Operator:可自主执行任务的 AI 智能体

OpenAI 的 AI 智能体布局开篇

OpenAI 首席执行官山姆・奥特曼(Sam Altman)在年初的一篇博客文章中表示,2025 年对于 AI 智能体而言将是意义重大的一年。AI 智能体这类工具能够自动执行任务,并代表用户采取行动。

如今,我们看到了 OpenAI 的首次实质性尝试。

周四,OpenAI 宣布推出 Operator 的研究预览版,这是一款通用型 AI 智能体,能够控制网页浏览器并独立执行特定操作。Operator 首先面向订阅 ChatGPT 200 美元 Pro 套餐的美国用户推出。OpenAI 称,计划最终将该功能推广至更多 Plus、Team 和 Enterprise 套餐的用户。

“(Operator)很快会在其他国家上线,”OpenAI 首席执行官山姆・奥特曼在周四的直播中说道,“遗憾的是,欧洲地区可能还需要一段时间。”

这一初始研究预览版可通过operator.chatgpt.com访问,但 OpenAI 表示,很快希望将 Operator 集成到其所有 ChatGPT 客户端中。

Operator 的功能与运行机制

据 OpenAI 介绍,Operator 有望实现诸如预订旅行住宿、餐厅订位以及在线购物等任务的自动化。在 Operator 界面中,用户可选择多个任务类别,包括购物、配送、用餐和旅行等,所有这些都支持不同类型的自动化操作。

当 ChatGPT 用户激活 Operator 时,会弹出一个小窗口,显示该智能体用于完成任务的专用网页浏览器,同时还会解释智能体正在执行的具体操作。由于 Operator 使用自己的专用浏览器,所以在其运行时,用户仍可控制自己的屏幕。

OpenAI 表示,Operator 由计算机使用智能体模型(CUA)驱动,该模型将公司 GPT – 4o 模型的视觉能力与 OpenAI 更先进模型的推理能力相结合。CUA 经过训练可与网站前端进行交互,这意味着它无需使用面向开发者的 API 来接入不同服务。

换句话说,CUA 能够像人类一样使用按钮、浏览菜单并在网页上填写表单。

OpenAI 称,它正在与 DoorDash、eBay、Instacart、Priceline、StubHub 和 Uber 等公司合作,以确保 Operator 遵守这些企业的服务条款协议。

OpenAI 在向 TechCrunch 提供的材料中写道:“CUA 模型经过训练,在完成具有外部影响的任务(例如提交订单、发送电子邮件等)之前,会请求用户确认,以便用户在操作生效前再次检查模型的工作。(它)在各种情况下已被证明很有用,我们旨在将这种可靠性扩展到更广泛的任务中。”

但 OpenAI 也警告称,CUA 并非完美。该公司表示,“目前还不期望 CUA 在所有场景下都能可靠运行。”

OpenAI 在一份支持文档中补充道:“目前,Operator 无法可靠地处理许多复杂或专业任务,例如创建详细的幻灯片、管理复杂的日历系统,或与高度定制化或非标准的网页界面进行交互。”

出于高度谨慎,对于一些 CUA 和 Operator 大多可自行执行的任务,如银行交易,OpenAI 也要求进行监督。例如,用户需要自行输入信用卡信息。OpenAI 称,Operator 不会收集或截图任何数据。

OpenAI 在其支持材料中表示:“在特别敏感的网站(如电子邮件)上,Operator 需要用户积极监督,以确保用户能够直接发现并纠正模型可能出现的任何潜在错误。”

这无疑限制了 Operator 的实用性,但也确保了该智能体不会出现幻觉,比如说,不会把你的房贷花在装饰椅上。谷歌在其 Mariner 项目 AI 智能体上也采取了类似做法,该智能体同样不会填写信用卡号码等信息。

Operator 的局限性

Operator 有几个值得注意的局限性。

它存在速率限制,包括每日限制和任务相关限制。OpenAI 表示,Operator 可以同时执行多个任务,但对此有 “动态限制”。此外,还有一个每日重置的总体使用限制。

在当前发布阶段,出于安全原因,Operator 还会直接拒绝执行某些任务,如发送电子邮件(尽管 CUA 有此能力)和删除日历事件。OpenAI 表示,未来这一情况会改变,但未给出具体时间。

如果遇到特别复杂的界面、密码字段或验证码检查,Operator 可能也会 “卡住”。OpenAI 称,此时它会请求用户接管操作。

AI 智能体的未来展望

与竞争对手(如 Rabbit、谷歌和 Anthropic 推出的智能体)相比,OpenAI 在开发 AI 智能体方面进展较为缓慢,这可能与该技术存在的安全风险有关。

当一个 AI 系统能够在网络上采取行动时,就为恶意行为者打开了更危险的用例之门。他们可以自动化 AI 智能体来策划网络钓鱼诈骗或 DDoS 攻击,或者让它们在其他人之前抢购演唱会门票。特别是对于像 ChatGPT 这样广泛使用的工具,OpenAI 采取措施防止此类滥用行为至关重要。

OpenAI 似乎认为,以 Operator 目前的形式发布是足够安全的,至少作为研究预览版是如此。

OpenAI 在其网站上解释道:“Operator 采用了一些工具,旨在降低模型对恶意提示、隐藏指令和网络钓鱼企图的易受性。如果检测到可疑活动,监控系统会暂停执行,同时自动化和人工审核流程会持续更新防护措施。”

Operator 是 OpenAI 迄今为止在创建 AI 智能体方面最大胆的尝试。上周,OpenAI 发布了 Tasks 功能,赋予 ChatGPT 简单的自动化特性,比如设置提醒以及安排每天在设定时间运行提示的能力。

Tasks 为 ChatGPT 用户提供了一些熟悉但必要的功能,使 ChatGPT 像 Siri 或 Alexa 一样实用。然而,Operator 展示出了上一代虚拟助手无法做到的能力。

AI 智能体被视为继 ChatGPT 之后 AI 领域的下一个重大突破:一种将改变人们使用互联网和个人电脑方式的新技术。智能体理论上不仅能够传递和处理信息,还能采取行动并切实完成任务。

随着 OpenAI 首次具体推出关于智能体的成果,这一愿景的现实可行性很快就会明晰。