你的位置:开云(中国)Kaiyun·官方网站 登录入口 > 新闻 > 欧洲杯体育CUA不错进行GUI交互-开云(中国)Kaiyun·官方网站 登录入口

欧洲杯体育CUA不错进行GUI交互-开云(中国)Kaiyun·官方网站 登录入口

发布日期:2026-03-26 10:12    点击次数:140

新闻

明敏 鱼羊 发自 凹非寺欧洲杯体育 量子位 | 公众号 QbitAI OpenAI热炒已久的智能体,刚刚负责发布! OpenAI官方先容: Operator是我们的首批智能体之一。这些AI好像悲怆为你完成责任—— 只需给它一个任务,它就会试验。 Operator是我们的首批智能体之一。这些AI好像悲怆为你完成责任—— 只需给它一个任务,它就会试验。 be like,给它一个购物清单,Operator就能有余自主地帮你买好东西。 不错看到操作老哥的双手也曾离开键盘,屏幕上的扫数操作齐是Opera

详情

欧洲杯体育CUA不错进行GUI交互-开云(中国)Kaiyun·官方网站 登录入口

明敏 鱼羊 发自 凹非寺欧洲杯体育

量子位 | 公众号 QbitAI

OpenAI热炒已久的智能体,刚刚负责发布!

OpenAI官方先容:

Operator是我们的首批智能体之一。这些AI好像悲怆为你完成责任—— 只需给它一个任务,它就会试验。

Operator是我们的首批智能体之一。这些AI好像悲怆为你完成责任—— 只需给它一个任务,它就会试验。

be like,给它一个购物清单,Operator就能有余自主地帮你买好东西。

不错看到操作老哥的双手也曾离开键盘,屏幕上的扫数操作齐是Operator我方完成。

还能让它来预定餐厅:

张开剩余87%

这边奥特曼直播刚齐备,OpenAI总裁Brockman就迫不足待地书记:

2025是智能体之年。

2025是智能体之年。

而且这一次,Operator官宣即上线——只不外,暂时只面向Pro用户,对,等于一个月200刀 (约合东说念主民币1458元)的阿谁大会员。

看罢直播,网友们还横蛮常高亢的,直呼“落拓星期四”。

然而嘛……

嗯,Operator很香,但若是开源就更棒了,DeepSeek、Meta快卷起来(doge)。

玩转浏览器,无需东说念主类支持

口说无凭,我们照旧先通过官方Demo,来望望Operator到底有多“自强派系”。

它实在不错使用任何网站,无需东说念主类的操作支持。

比如从Allrecipes上找到一份蛤蜊扁面条的食谱,然后把扫数的食材齐放到我instacart的购物车里?

它操作这一切的逻辑和东说念主类同样,看到了哪些图片、该点击哪些按钮。

这和其他使用API或者基于编程接口的Agent不同,它是基于文本的念念维链进行推理。

说明佳肴单后,去哪个店下单买菜呢?

东说念主类进一步给出指示,使用Gus’s,然后Operator就会到对应的网站开动下单。

遭受登录、支付等操作时,Operator会将操作权交还给用户。

在用户实测中,有博主发现如果Operator被Reddit墙了,它还会我方在搜索时就加入“Reddit”要道词以找到干系帖子。

用户也不错通过添加自界说指示,得到个性化体验。比如成就订机票时的首选航司。

Operator允许用户保存请示,以便在主页上快速侦查,相称允洽访佛任务,如在购物网站上补货。

Operator的底层使用了一个全新的模子 Computer-Using-Agent(CUA)。

通过将GPT-4o的视觉智力和高档推理强化学习相纠合,CUA不错进行GUI交互。

Operator不错看到网页界面的实质,使用鼠标、键盘允许的扫数操作。由此它不错自动操作,而无需自界说的API集成。

如果遭受问题或者出现诞妄, Operator不错诈欺推贤慧力自我纠错。并在它卡住需要匡助时,将规则权交还给用户。

CUA在WebArena和WebVoyager两个基准测试中齐取得了SOTA。

当前,好意思区的Pro会员也曾不错通过operator.chatgpt.com来使用Operator。Plus、Team、Enterprise等付用度户和其他地区的胖友们,还得再等等,但OpenAI快活异日会将这些功能集成到ChatGPT中。

OpenAI迈入“Level 3”

2024年7月,OpenAI发布了“从AI到AGI的五步流程”:

Level 1:Chatbots,AI不错以对话的状貌与东说念主互动。

Level 2:Reasoners,AI科技搞定东说念主类水平的问题。

Level 3:Agents,AI不错行为系统试验一些步履任务。

Level 4:Innovators,AI不错拓荒更动性的AI。

Level 5:Organizations,AI不错完成一个组织完成的责任。

Level 1:Chatbots,AI不错以对话的状貌与东说念主互动。

Level 2:Reasoners,AI科技搞定东说念主类水平的问题。

Level 3:Agents,AI不错行为系统试验一些步履任务。

Level 4:Innovators,AI不错拓荒更动性的AI。

Level 5:Organizations,AI不错完成一个组织完成的责任。

在那时的界说和探讨中,OpenAI暗示我方还只处于Level 1阶段,正在围聚Level 2。

而当今,跟着Operator的发布,奥特曼书记:

这是我们干涉Level 3的开动。

这是我们干涉Level 3的开动。

值得逼迫的是,就像泉源提到,OpenAI暗暗画了个要点:Operator还仅仅“ 首批”而非独一智能体。

在直播中,奥特曼也预报了:

我们还将在异日几周和几个月内推出更多智能体。

我们还将在异日几周和几个月内推出更多智能体。

One More Thing

就在OpenAI今天这场直播之前,还有一个小小的花絮。

Operator发布2小时前,OpenAI发了一条推文,暗示成就了ChatGPT和API诞妄率高的问题。

又虚晃了网友们一枪(doge)。

另一个好音信是,奥特曼还预报,ChatGPT免费版就能用上o3-mini。

— 完—

量子位智库年终发布 三大年度论说!

带你沿路归来2024年 东说念主工智能、 智能驾驶、 Robotaxi新趋势, 猜想2025年科技行业新机遇!

2024年度AI十大趋势论说

Robotaxi2024年度步地论说

智能驾驶2024年度论说欧洲杯体育

发布于:北京市

公司地址

新闻科技园大厦4706号

关注我们

公司官网

www.ynlfgtc.com

Powered by 开云(中国)Kaiyun·官方网站 登录入口 RSS地图 HTML地图


开云(中国)Kaiyun·官方网站 登录入口-欧洲杯体育CUA不错进行GUI交互-开云(中国)Kaiyun·官方网站 登录入口