跳到主要内容

浏览器与电脑控制

浏览器和电脑控制工具让 Agent 能进入真实界面:打开网页、读取页面、点击按钮、填写表单或辅助完成重复操作。它们很强,也最需要边界。

适合的任务

适合让 Agent 做低风险、可复核、步骤明确的操作,例如打开资料页、抓取公开信息、整理网页内容、检查页面状态或辅助填写草稿。

不适合直接放权的任务

涉及支付、删除、发布、发消息、改权限或提交正式表单时,应保留人工确认。浏览器里的登录态往往代表真实身份,不能把“能点”理解为“应该点”。