前言
大家好,我是于子月。今天给大家分享 OpenClaw 如何接管浏览器。我们用最新的 OpenClaw 加上最新版本的 Chrome,看一下 OpenClaw 接管浏览器能够接管到什么程度。本文将分享六个实际案例,帮助大家掌握这一强大的浏览器自动化工具。
六大案例包括:
- 微博自动发文——自动获取热搜榜单并发布内容
- 自动生成 Scale——将操作流程自动化记录
- 网页截图自动化——自动截取搜索结果页面
- 自动生成 PDF 学习资料——与 AI 交互获取学习资料并生成 PDF
- 模拟爬虫爬取数据——自动采集 B 站视频信息
- 调研报告生成 PPT——快速生成行业调研演示文稿
一、MCP 协议简介
OpenClaw 要和浏览器进行交互,需要用到 MCP(Model Context Protocol),也就是模型的上下文协议。
Chrome 浏览器与 MCP 协议的结合,主要体现在将浏览器作为一个数据源或操作接口。让每一个支持 MCP 的代理 Agent 都能够独立于底层模型,使用 DevTools 的强大功能。
这个功能在 Chrome 的 142、143、144 这几个版本就有了。在 144 版本的时候做了一个全面的更新。
二、配置步骤
1. Chrome 浏览器配置
步骤 1:升级 Chrome
首先需要将 Chrome 升级到最新版本(推荐 144 及以上)。
步骤 2:开启远程调试
访问 Chrome 远程调试页面:chrome://inspect
开启"允许远程调试"功能,默认端口为 9222。这就是 OpenClaw 连接浏览器使用的调试端口。
步骤 3:macOS 额外配置
如果是 macOS 系统,默认禁用了执行 JS 的功能,需要把这个功能给打开。
2. OpenClaw 配置
步骤 1:更新 OpenClaw
openclaw update
将 OpenClaw 更新到最新(当前最新是 26323)。
步骤 2:修改配置文件
需要修改两个地方的配置:
- 浏览器配置:设置调试端口为 9222,使用 existing session(不启动新浏览器)
- 工具配置:将 profile 改成 user,使用用户级别的配置
步骤 3:重启 Gateway
openclaw gateway restart
步骤 4:验证连接
使用命令查看浏览器状态,Chrome 会弹出"是否允许远程调试",点击允许即可。
三、六大实操案例
案例 1:微博自动发文
场景:获取微博热搜榜单内容,自动生成总结并发布。
操作流程:
- 使用 MCP 方式进入微博首页
- 获取热搜榜单前 5 条内容
- 根据热搜榜第一的内容编写接地气的总结
- 自动发布微博
效果:从获取热搜到发布完成,整个过程 10 秒钟不到。
案例 2:将操作流程生成 Scale
场景:将复杂的操作流程自动化,生成可复用的 Scale。
用法:配置完成后,可以直接使用类似 weiboPost 的命令发布微博,无需重复输入复杂指令。
案例 3:网页截图自动化
任务:在 B 站搜索"OpenClaw",将搜索结果的第一页和第二页截图,生成两张图片保存到桌面。
注意点:
- 页面可能超过屏幕高度,需要滑动截图
- OpenClaw 会自动解析浏览器中的 HTML 结构,找到对应的按钮
- 这个过程会比较慢,因为需要解析各种 HTML 结构
案例 4:自动生成 PDF 学习资料
任务:进入 Kimi 聊天页面,生成小学三年级的英语对话练习资料。
要求:需要与 Kimi 进行三次对话,每次对话生成一个章节,总共生成三个章节。每个章节有一个学习对话的内容,对话次数不低于 20 次。然后将生成的三个章节生成到一个 PDF 里面,保存到桌面。
实现方式:OpenClaw 会编写 Python 脚本,使用 Markdown、HTML 等模块生成对应的 MD 文件,然后再将 Markdown 转换成 PDF。最终生成 HTML、PDF、TXT 三种格式的文件。
案例 5:模拟爬虫爬取数据
任务:进入 B 站搜索关键字,前两页内容获取每一个视频的标题、发布时间、播放数量,然后把数据保存成 Excel 放到桌面。
技巧:如果这个过程有出错的话,需要将提示词更细化,就是告诉它进哪个页面,然后点击哪些按钮,这样成功率会更高一些。先写脚本导入 CSV 格式,再转换成 Excel 格式。
结果:成功获取 60 个视频的信息,包括序号、标题、播放量、发布时间、UP 主等信息。
案例 6:调研报告生成 PPT
场景:有时候我们想快速了解某个行业,这个时候可以用 AI 帮忙生成,帮忙调研,然后去生成 PPT。
两种方式:
- 方式 1 - Python 直接生成:直接用谷歌搜索关键字"OpenClaw 落地应用",搜集到相关信息以后,将内容做成五页的 PPT。这个没有指定用哪个网站去做 PPT,它就会默认去直接用它内置的 Python 编写生成一个 PPT。这种方式生成的 PPT 比较简洁,没有太多的效果。
- 方式 2 - 专业 PPT 网站:搜集到相关信息以后,打开专门的 PPT 生成网站(如 Workss.AI 等),让它做成 PPT。这种方式生成的效果更好,但下载以后还需要按照自己的喜好进行修改才能使用。
四、总结
通过 MCP 协议,OpenClaw 实现了对 Chrome 浏览器的深度集成,让 AI Agent 能够:
- 自动浏览网页——像人类一样点击、输入、滚动
- 提取信息——从网页中获取结构化数据
- 执行操作——自动发布内容、生成文档、截图等
- 无缝对接——与各种在线工具(Kimi、PPT 生成网站等)配合
这大大扩展了 AI 智能体的能力边界,让自动化工作流程变得更加简单高效。希望本期内容对你有所帮助,欢迎关注订阅,点赞收藏!
← 返回首页