




下面根据公开资料整理了在网页版使用 ChatGPT 的代理模式(Agent mode)和在 Codex 中使用代理的主要区别。核心差别在定位和能力:ChatGPT 代理侧重一般性的互联网操作与自动化任务,Codex 侧重软件工程任务和代码执行。
功能定位
- ChatGPT 网页代理(Agent mode)
:这是 ChatGPT 内置的一种虚拟助理模式。启用后,系统会启动一个虚拟电脑,配备可视化浏览器、文本浏览器、终端、API 调用接口以及可选的 Gmail/GitHub 等连接器。用户只需描述目标,代理会自行选择合适的工具来浏览网页、点击按钮、运行 Python、编辑文件等。它适合做会议准备、竞争对手调研并生成幻灯片、清理/分析电子表格、自动草拟邮件或在购物网站放入商品并在最后一步确认结账。代理每一步操作都会在活动日志中显示,系统会在执行高影响动作前征求许可。 - Codex 代理
:最初作为 ChatGPT 的编程代理推出,现已提供 CLI、IDE 扩展和桌面应用。Codex 专为软件工程任务优化,可以读取整个代码仓库、制定多步骤计划,在云端沙箱中运行代码并反复执行测试。当用户描述任务(例如修复竞态条件或添加测试),Codex 会启动隔离的虚拟机,克隆仓库,计划方案,修改/添加文件,运行测试并生成 pull request;整个过程是异步进行的,用户查看的是结果而不是过程。Codex 还能借助“skills”机制调用特定工具,比如读取 Figma 设计转为前端代码、编辑表格和文档、部署应用或按排程自动执行检查与汇报。
关键差异概览
| 主要用途 | ||
| 执行模式 | ||
| 可访问的资源 | ||
| 反馈方式 | ||
| 适用人群 |
小结
在网页代理模式中,ChatGPT 像一个“通用秘书”,通过浏览器、终端等工具完成互联网操作及办公文档制作,强调实时互动和安全确认。 在 Codex 中,代理更像一名“初级程序员”,在隔离的云端环境中自动阅读、编写和测试代码,任务可异步执行并产生可直接合并的 Pull Request。 因此,选择哪个模式取决于任务类型:日常非编程任务适合网页代理,复杂的软件工程任务则应交给 Codex。




ChatGPT 网页代理使用说明
1. 代理模式概述
ChatGPT 的网页代理模式(Agent mode)是一种集成在网页版 ChatGPT 中的虚拟助理。启用该模式后,系统会启动一台云端虚拟电脑,并按照用户描述的目标自动选择不同工具完成任务。它可以浏览网页、点击按钮、运行 Python 代码、编辑文件,还能接入企业中的 SharePoint、OneDrive 或 Notion 数据等。[1]
2. 如何启用代理模式
1) 打开 ChatGPT 对话界面,在对话框上方选择“Tools(工具)”。
2) 在下拉菜单中点击“Agent mode(代理模式)”。
3) 选择建议、报告、操作、电子表格、演示文稿等预设任务类型,或直接描述自己的任务需求。
4) 提交后,代理会启动虚拟电脑并开始执行任务,用户可以通过“活动”窗口实时查看其操作。
3. 代理模式内的工具
网页代理拥有多个工具组件,帮助自动完成任务:
·可视化浏览器:提供类似普通浏览器的界面,可滚动、点击、登录并与任何网站交互。
·文本浏览器:用于快速抓取长网页的文本内容并进行分析或推理。
·终端:可以运行 Shell 或 Python 脚本,用于数据处理或脚本自动化。
·直接 API 调用:当使用 API 比浏览器更高效时,代理会直接调用接口。
·连接器:可读取 Gmail、GitHub 等应用的只读数据,为任务提供更多上下文。
用户只需描述目标,代理会根据需要自动组合这些工具完成任务。[1]
4. 常见用例
网页代理可用于以下场景:
·会议准备:拉取日历、查找客户近况并生成简报。
·竞争对手调研与幻灯片:比较供应商、收集规格与价格,并自动生成幻灯片。
·电子表格处理:上传杂乱的 CSV,自动清理数据、预测并绘制图表,生成整洁的模型。
·自动化电子邮件:起草邮件、总结邮件线程或根据 CRM/Gmail 数据准备个性化回复。
·购物助手:寻找商品、比较价格并放入购物车,最后询问用户确认再结账。
这些示例显示,代理不仅能搜索信息,还能生成文档、表格和演示文稿,执行多步骤任务。[2]
5. 安全与权限
为了保护用户数据和避免不必要的操作,网页代理内置了多重安全措施:
·在执行可能影响账户或产生费用的操作前,代理会主动要求用户明确授权。
·进入敏感链接或执行高风险操作时会提示用户,确保用户知情。
·所有任务都有详细的操作日志,便于用户查看代理的每一步。
·支持一键清空沙箱环境,可快速删除浏览记录和数据。
Agent mode 目前仅向 Plus、Pro 和 Team 用户开放,其他计划陆续推出。[3]
6. 使用技巧与限制
使用网页代理时,可参考以下建议:
·明确描述任务目标,提供必要的上下文,如网址、文件或具体需求。
·关注“活动”窗口,了解代理正在执行的步骤,并在必要时接管浏览器。
·注意代理模式的使用次数限制(例如每月有一定次数),合理规划任务。
·在需要定期重复任务时,可以使用任务推送功能设置周期性执行。
·对于涉及付款或个人隐私的信息,谨慎授权并核对代理操作的每一步。
7. 结语
ChatGPT 网页代理通过整合浏览器、终端等多种工具,为用户提供自动执行复杂任务的能力。从信息收集到文档生成,再到简单的购物和邮件处理,它可以极大提升工作效率。但在使用过程中请注意安全提示和任务限制,根据实际需求合理安排。
参考资料
[1] LinkedIn 中关于 ChatGPT Agent mode 的介绍,列举了代理自带的工具(可视化浏览器、文本浏览器、终端、API 调用和连接器)【968272705389017†L62-L77】。
[2] 同一文中罗列的 Agent mode 的常见用例:会议准备、竞争调研与幻灯片、表格处理、邮件自动化、购物助手【968272705389017†L83-L94】。
[3] 文中指出的安全措施:要求明确授权、敏感操作提示、操作日志和一键沙箱清除,并说明 Agent mode 目前对 Plus/Pro/Team 用户开放【968272705389017†L109-L117】。
网友评论