1) 计划:将意图转化为清单
规划应简短且具体。好的计划有边界(不做什么)、检查点(什么算“完成”),以及所需输入(登录信息、URL、时间范围)。
输入
哪些网站,什么账户上下文,什么时间窗口,哪些字段重要。
约束条件
避免敏感表单,设置最大页面数,提交前确认,保持工作区边界。
完成标准
你需要什么输出:CSV、报告、摘要,或带验证的完整工作流程。
2)执行:真实界面操作
“执行”意味着浏览器可以真正地操作:点击按钮、填写表单、跟随多页流程,并处理动态界面。产品应展示其正在执行的操作——这样你可以随时终止。
导航
打开页面、切换标签、跟随链接、从重定向中恢复。
表单填写
仔细填写字段,进行校验,且绝不会在未经你确认的情况下提交。
提取
从你有权限访问的页面中采集结构化数据,并保留来源。
多步骤工作流
执行 A → B → C,包含检查点、重试和超时。
3)验证:"完成"是已检查状态
验证是代理与猜测者的区别。"已验证"意味着浏览器检查页面状态,确认输出存在,并展示证据(如:界面变化、导出的文件、带来源的摘要)。
状态检查
预期的界面是否出现?提交是否成功?结果是否可见?
证据
步骤日志、来源列表、快照,或带有链接的报告——可以进行审查的内容。
备用方案
如果验证失败,代理会请求指导,而不是默默地“完成”任务。
三种实用流程,测试任何代理型 AI 浏览器
用能揭示深度和控制力的任务进行评估。如果通过这些测试,“agentic”很可能是真实的。
工作流程 A:研究简报
搜索 → 打开 10 个来源 → 提取核心观点 → 带引用总结 → 生成 1 页简报。
工作流程 B:运营
登录 → 跳转到仪表盘 → 更新字段 → 确认预览 → 提交(含确认步骤)。
工作流程 C:可重复的例行操作
每日:开放资源 → 捕捉变更 → 记录结果 → 分享统一报告格式。
下一步:尝试一款专为真实执行打造的浏览器
如果你选择“智能代理 AI 浏览器”的目标是减少重复的网页操作,Tabbit 是一个实用的起点:自动执行、工作空间、研究与报告。