栏目分类

新闻中心

你的位置：开云体育(中国)官方网站 - 开云 SPORTS > 新闻中心 > 开云kaiyun体育甚而输出可剪辑的幻灯片和电子表格-开云体育(中国)官方网站 - 开云 SPORTS

开云kaiyun体育甚而输出可剪辑的幻灯片和电子表格-开云体育(中国)官方网站 - 开云 SPORTS

发布日期：2026-07-02 04:41 点击次数：63

已往泰半年，Agent（智能体）是 AI 行业最常被说起的见地之一。

简直扫数厂商皆在讲 Agent，见地不缺，demo 也不少，但着实作念到家具级落地，恒久缺一套完好的实行系统——既能相识复杂指标，又能调用多种器具串联任务经过，还要随时撑合手任务中断、修改与复原，着实贴合用户使命流。

就在刚刚，OpenAI 崇拜发布 ChatGPT Agent 功能。

通过整合 Operator + Deep Research + ChatGPT 本色，用户只需描摹任务，ChatGPT Agent 就能自主判断所需器具，自动造访网页、索求信息、运行代码、生成幻灯片或表格等，并可在实行过程中及时展示行动、接受中断和修改指示。

张开剩余89%

发布会结尾后，OpenAI CEO Sam Altman 在外交媒体上写谈：：

不雅看 ChatGPT Agent 使用盘算机完成复杂任务，对我来说是一个着实的「感受 AGI」时刻；看到盘算机想考、盘算和实行，有种名满宇宙的嗅觉。

亮点如下：

ChatGPT Agent 将 Operator、Deep Research 与 ChatGPT 本色三合一，构建了一个和谐智能体系统。内置图形/文本浏览器、末端和 API 调用器等器具，撑合手手机端使用，任务完成后可自动推送甩掉；可畅达 Gmail、GitHub 品级三方应用，深度镶嵌用户确实使命流；在多项基准测试中发扬最初，轮廓性能位居行业前哨；Pro 用户每月享有 400 条调用额度，其他付用度户为 40 条，并撑合手按需扩张配额。

ChatGPT Agent 崇拜上线，能购物，能写 PPT，你的浏览器要被 AI 经受了

今天启动，你不错在职何对话中，通过聊天界面左下角的「器具」下拉菜单，遴荐「Agent 模式」来启用这一功能。

只需描摹你想完成的任务，ChatGPT 简略智能地浏览网站、筛选甩掉、在需要时安全教导你登录、运行代码、实行分析，甚而输出可剪辑的幻灯片和电子表格，顾虑任务甩掉。

扫数这个词实行过程是可视的——操作行动会及时表露在屏幕上，用户不错随时中断、修改指示，甚而手动「经受浏览器」无间操作，确保任务恒久合适你的指标和需求。

在今天凌晨的演示中，OpenAI 展示了 ChatGPT Agent 在确实场景中的应用能力。

比如，为行将出席的婚典作念准备，一直是个艰难。当今只需发出肯求，ChatGPT Agent 速即搭建编造环境，自主判断应调用浏览器、文本领略器依然末端，并启动挨次调取婚典日期、查询场面天气、推选西装搭配、筛选旅店。在这个过程中，模子不错与 OpenAI 策动员进行互动，并在适合节点肯求说明需求。

更伏击的是，用户不错随时中断任务。

比如当 Agent 在推选西装过程中，OpenAI 策动员临时插入了「帮我找一对 9.5 码玄色正装鞋」的肯求，模子坐窝暂停刻下任务，转而处理新需求。

相同地，当智能体以为有必要时，也会主动向你肯求更多信息，确保任务恒久与你的指标保合手一致。要是任务超出预期时刻或出现卡顿，你不错遴荐暂停任务、肯求程度节录，或径直阻隔任务并获取已有的部分甩掉。

「这种可打断、可多轮对话的机制，是咱们此次考验模子的重心之一，」OpenAI 策动员评释谈。

这一能力背后，是 ChatGPT Agent 对三大系统的和谐整合：Operator 提供网页交互能力，撑合手自动升沉、点击、填表；Deep Research 擅长信息整合与分析；ChatGPT 本色则负责自然说话相识与智能推理。

ChatGPT Agent 是通过强化学习在复杂的任务中考验出来的，已往三者各有短板——前者难以潜入分析，后者无法操作网页，而 Agent 将三者上风整合为一体，并辅以浏览器、末端、API 调用器等器具，形成一个完好的实行系统。

用户不仅不错在桌面端启动 Agent 模式，在手机端也相同适用。

任务完成后还将自动推送甩掉见知。在第二个演示任务中，OpenAI 策动员在 ChatGPT App 上传了团队祯祥物 Bernie Doodle 的贴纸图案，Agent 自动调用图像生成 API 瞎想贴纸样式，通过浏览器造访电商平台完成比价、样式遴荐、购物车添加，最终整理出定制贴纸的下单明细。

自然，为确保经过安全、天真且赫然可控，濒临波及金额的支付要津，则只会由用户手动经受浏览器完成。

通过畅达器，用户还可将 Gmail、GitHub 等平素应用接入 ChatGPT，让模子读取邮件、日期或代码库等荆棘文内容，并实行诸如顾虑今天的邮箱内快活查找下周称心会议时刻等任务。

一个更典型的应用场景是，OpenAI 策动员简略让 ChatGPT Agent 汇总我方在多项基准测试中的发扬，并制作成幻灯片。收到敕令后，Agent 会调用 Google Drive 畅达器读取数据文献，用末端编写代码绘图图表，并生成完好的 PPT。

这类自动化能力，皆是 Agent 深度镶嵌使命流的体现。

不外，不错看到，ChatGPT Agent 生成的 PPT 在瞎想审好意思方面发扬比拟一般，况兼，固然不错上传电子表格供 ChatGPT 剪辑或行为模板使用，但生成的 PPT 暂不撑合手二次修改。

需要说明的是，OpenAI 并不是让 Agent 像东谈主一样大开 PPT或 Excel 文献，通过点击来插入文本框和公式，而是径直生成代码来创建文档。这种作念法的克己是不错运用模子在代码编写方面的自然上风，幸免因模拟点击操作带来的后果低下或出错，也裁减了对盘算资源的破坏。

The Information 报谈指出，要是 ChatGPT 要径直剪辑 PPT 或 Excel 文献，就需要启动一台「编造机」（即通过 ChatGPT 运行的编造盘算机环境），这会占用更多盘算资源。

而径直生成代码则更轻量、高效。尽管后劲精深，但就面前来看，这一功能短期内很难对微软的 Office 或者 Google Workspace 变成冲击。

对于 ChatGPT Agent 功能，Pro 用户将在今天之内赢得造访权限；Plus 与 Team 用户将在接下来的几天内陆续通达；企业版（Enterprise）和训导版（Education）将在明天几周内上线

Pro 用户每月可使用 400 条音书，其他付用度户每月可使用 40 条音书，并可通过弹性积分有规划购买更多额度。

全线刷新「跑分」记录，Agent 战场迎来最强敌手

ChatGPT Agent 能力的进步，也体当今「跑分」要津。

在评估 AI 管束跨学科大家级问题的基准测试 Humanity’s Last Exam（HLE）中，搭载智能体的 ChatGPT 模子以 41.6 的 pass@1 得分刷新记载。在启用并行实行政策后，该得分进一步进步至 44.4。

在面前被以为最具挑战性的数学基准 FrontierMath 中，濒临难度极高、从未公开的题目，ChatGPT Agent 在具备末端代码实行能力的前提下，取得了 27.4% 的准确率，远高于此前模子。

在这一复杂且高经济价值的常识型使命任务的里面基准测试中，ChatGPT Agent 在约一半的任务中输出质地已达到甚而杰出东谈主类水平，发扬也显耀优于 o3 和 o4-mini 模子。

在一个里面的投行建模任务基准中，ChatGPT 智能体的发扬也显耀优于 Deep Research 和 o3 模子。每个任务皆基于数百项对于公式正确性、体式轨范等评分行动进行评估。

此外，在公开评估模子信息查找能力的 BrowseComp 基准上，Agent 以 68.9% 的准确率刷新记录，较 Deep Research 跳跃 17.4 个百分点。在 WebArena 评估中，其网页任求实行能力也优于基于 o3 的 CUA 模子。

从平台视角看，Agent 能力的底层接口，恰是浏览器。

在 Perplexity AI CEO Aravind Srinivas 最近的采访中，他示意浏览器将会是 AI 的「杀手级应用」。在他看来，浏览器自然具备让 AI 着实「动起来」的一齐条款。

不同于传统聊天机器东谈主，AI Agent 的联想方法不是停留在对话框中生成文本，而是具备执行行能源——从造访网页、索求信息、填写表单，到实行跨平台操作。而这一切，浏览器正巧具备所需的操作权限和荆棘文获取能力。

浏览器不错径直读取页面、模拟点击、自动实行任务，简直无需异常授权。

在这个过程中，用户与 AI 共处于吞并个交互空间：AI 不错自动实行任务，用户也能随时中断或经受，幸免黑盒操作带来的不笃定性。这种可控性与透明度，是刻下很多荆棘文契约仍难完了的能力。

如今，跟着 ChatGPT Agent 能力崇拜上线，扫数宣称要作念 Agent 的厂商，惟恐皆要从头扫视我方的家具旅途。

当 ChatGPT 从说话交互器具，转向具备相助、调治与联络任务能力的实行系统开云kaiyun体育，启动接入用户的确实使命流，Agent 的可用性门槛，也在此刻被实质性地拉高。

发布于：北京市

上一篇：开云kaiyun其劳动已笼罩宇宙200多座城市-开云体育(中国)官方网站 - 开云 SPORTS

下一篇：没有了