OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

963次阅读
没有评论

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

明敏 鱼羊 发自 凹非寺

量子位 | 公众号 QbitAI

OpenAI热炒已久的智能体,刚刚正式发布!

OpenAI官方介绍:

Operator是我们的首批智能体之一。这些AI能够独立为你完成工作——只需给它一个任务,它就会执行

be like,给它一个购物清单,Operator就能完全自主地帮你买好东西。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

可以看到操作老哥的双手已经离开键盘,屏幕上的所有操作都是Operator自己完成。

还能让它来预定餐厅:

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

这边奥特曼直播刚结束,OpenAI总裁Brockman就迫不及待地宣布:

2025是智能体之年。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

并且这一次,Operator官宣即上线——只不过,暂时只面向Pro用户,对,就是一个月200刀(约合人民币1458元)的那个大会员。

看罢直播,网友们还是非常兴奋的,直呼“疯狂星期四”。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

但是嘛……

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

嗯,Operator很香,但要是开源就更棒了,DeepSeek、Meta快卷起来(doge)。

玩转浏览器,无需人类辅助

口说无凭,咱们还是先通过官方Demo,来看看Operator到底有多“独立自主”。

它几乎可以使用任何网站,无需人类的操作辅助。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

比如从Allrecipes上找到一份蛤蜊扁面条的食谱,然后把所有的食材都放到我instacart的购物车里?

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

它操作这一切的逻辑和人类一样,看到了哪些图片、该点击哪些按钮。

这和其他使用API或者基于编程接口的Agent不同,它是基于文本的思维链进行推理。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

确认好菜单后,去哪个店下单买菜呢?

人类进一步给出指令,使用Gus’s,然后Operator就会到对应的网站开始下单。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

遇到登录、支付等操作时,Operator会将操作权交还给用户。

在用户实测中,有博主发现如果Operator被Reddit墙了,它还会自己在搜索时就加入“Reddit”关键词以找到相关帖子。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

用户也可以通过添加自定义指令,获得个性化体验。比如设置订机票时的首选航司。

Operator允许用户保存提示,以便在主页上快速访问,非常适合重复任务,如在购物网站上补货。

Operator也能同时运行多个任务,就像是打开多个网页那样,比如让它在Etsy上订购个性化的搪瓷马克杯,同时在Hipcamp上预订露营地。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

Operator的底层使用了一个全新的模型Computer-Using-Agent(CUA)

通过将GPT-4o的视觉能力和高级推理强化学习相结合,CUA可以进行GUI交互。

Operator可以看到网页界面的内容,使用鼠标、键盘允许的所有操作。由此它可以自动操作,而无需自定义的API集成。

如果遇到问题或者出现错误,Operator可以利用推理能力自我纠错。并在它卡住需要帮助时,将控制权交还给用户。

CUA在WebArena和WebVoyager两个基准测试中都取得了SOTA。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

目前,美区的Pro会员已经可以通过operator.chatgpt.com来使用Operator。Plus、Team、Enterprise等付费用户和其他地区的胖友们,还得再等等,但OpenAI承诺未来会将这些功能集成到ChatGPT中。

OpenAI迈入“Level 3”

2024年7月,OpenAI发布了“从AI到AGI的五步过程”:

  • Level 1:Chatbots,AI可以以对话的方式与人互动。
  • Level 2:Reasoners,AI科技解决人类水平的问题。
  • Level 3:Agents,AI可以作为系统执行一些行动任务。
  • Level 4:Innovators,AI可以开发创新性的AI。
  • Level 5:Organizations,AI可以完成一个组织完成的工作。

在当时的定义和规划中,OpenAI表示自己还只处于Level 1阶段,正在靠近Level 2。

而现在,随着Operator的发布,奥特曼宣布:

这是我们进入Level 3的开始。

值得注意的是,就像开头提到,OpenAI悄悄画了个重点:Operator还只是“首批”而非唯一智能体。

在直播中,奥特曼也预告了:

我们还将在未来几周和几个月内推出更多智能体。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

One More Thing

就在OpenAI今天这场直播之前,还有一个小小的花絮。

Operator发布2小时前,OpenAI发了一条推文,表示修复了ChatGPT和API错误率高的问题。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

又虚晃了网友们一枪(doge)。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

另一个好消息是,奥特曼还预告,ChatGPT免费版就能用上o3-mini。

OpenAI突发Operator!完全自主玩转浏览器,奥特曼:Level3时代开启

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 1 月
 12345
6789101112
13141516171819
20212223242526
2728293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行

“昆山杯”第二十七届清华大学创业大赛决赛举行 一水 2025-12-22 17:04:24 来源:量子位 本届...
MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law

MiniMax海螺视频团队首次开源:Tokenizer也具备明确的Scaling Law 一水 2025-12...
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026

真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026 量子位的朋友...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线

小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线

小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线 克雷西 2025-12-18 08:57:11 ...
ISC.AI 2025创新百强颁奖典礼落幕,首发智能体专家驱动产业升级

ISC.AI 2025创新百强颁奖典礼落幕,首发智能体专家驱动产业升级

ISC.AI 2025创新百强颁奖典礼落幕,首发智能体专家驱动产业升级 量子位的朋友们 2025-12-18 ...
具身智能的数据难题,终于有了可规模化的解法

具身智能的数据难题,终于有了可规模化的解法

具身智能的数据难题,终于有了可规模化的解法 思邈 2025-12-18 14:20:44 来源:量子位 成立4...
医生版ChatGPT,估值120亿美元

医生版ChatGPT,估值120亿美元

医生版ChatGPT,估值120亿美元 Jay 2025-12-18 13:45:12 来源:量子位 Jay ...
国产AI芯片看两个指标:模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026

国产AI芯片看两个指标:模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026

国产AI芯片看两个指标:模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026 西风 2025-12-...