42md 知识工具大升级(10)screenshot:网页全页截图,长博客 / Web App 完整留底
想存档一篇长博客 / GitHub README / 在线文档 / 微信小程序 H5 落地页?普通浏览器截图工具只能抓首屏,但很多网页是无限滚动的——首屏完全代表不了内容。`42md tools screenshot` 用 headless 浏览器对 URL 自动滚动并全页截图为 PNG:完整 viewport,JavaScript 执行后的真实 DOM,懒加载图片就绪。CLI 仅,免费转换,不消耗 AI 配额。
一、为什么要做 screenshot
很多场景需要把网页完整留到本地:
- 一篇长博客 / 公众号文章想存档——内容很长,截图比转 Markdown 更直观
- 一份在线文档 / Web App 界面要做产品备份——HTML 转 Markdown 损失大,截图就是真相
- 项目主页 / 产品落地页改版前留个原貌
- 微信小程序 / H5 落地页归档——内容是动态加载的
普通浏览器截图工具只能抓首屏。但很多网页是无限滚动的——一篇长文章、一个 GitHub README、一份在线文档——首屏完全代表不了内容。
42md tools screenshot 用 headless 浏览器跑一遍页面,自动滚动到底 + 等懒加载图片就绪 + 全页截图为 PNG。
二、screenshot 的特色
- 全页截图,不止首屏——自动滚动到底,懒加载图片完整加载后再截图
- 真实渲染——JavaScript 执行后的最终 DOM,动态生成的内容也能抓
- PNG 输出——跨平台兼容性高,归档场景常用
- 输入是 URL,输出是 .png,纯本地浏览器渲染,不调任何外部服务
- 免费转换,不消耗任何 AI 配额
三、怎么用 · CLI
# 基本用法
42md tools screenshot https://example.com
# 指定输出路径
42md tools screenshot https://example.com -o ~/Desktop/snapshot.png
小技巧:
- 长博客 / 长文档专用——首屏截图工具搞不定的场景这个能搞定
- 产品改版前的「时光胶囊」——一行命令把当前版本的页面状态留底
- 配合
tools download做完整归档:一边 download 抓站内 PDF / 资源,一边 screenshot 给每个重要页面留 PNG - 国内网络配合系统代理使用(clash / v2ray 等)
注意事项:
- 默认输出
<tempdir>/42md-screenshot/<时间戳>/<stem>.png;指定-o可覆盖默认路径 - 此工具需要本地 headless 浏览器支持,部分轻量版安装可能不带(提示「此版本未启用截图功能」时安装完整版即可)
- 当前仅 CLI 提供,webapp 端能力随产品演进逐步开放
四、适合的场景
| 想做什么 | 用 screenshot |
|---|---|
| 一篇长博客存档 | ✅ 全页 PNG,版式 / 色彩都在 |
| GitHub README 留档 | ✅ 滚动到底完整保留 |
| 在线文档 / Web App UI 备份 | ✅ JavaScript 执行后真实 DOM |
| 项目主页改版前快照 | ✅ 一行命令时光胶囊 |
| 微信 H5 / 小程序落地页 | ✅ 移动端版式真实呈现 |
不适合的场景:
| 想做什么 | 推荐工具 |
|---|---|
| 想转 Markdown 接下游加工(翻译 / 二次编辑) | 用主命令 42md https://example.com |
| 想批量抓站内 PDF 资源 | 用 tools download |
五、实际演示

更多样本见 screenshot 演示中心。
六、常见问题
能抓 JavaScript 执行后的页面吗?
可以。用 headless 浏览器跑一遍页面,DOM 是 JavaScript 执行后的最终状态。动态加载的内容、懒加载图片、SPA 路由后的视图都能抓到。
无限滚动 / Twitter / 微信文章 这种长页能完整抓吗?
绝大多数能。screenshot 会自动滚动到底,等待加载,再截图。极端长(数万行)的页面截图后会得到很大的 PNG,建议视场景考虑是否分屏。
能抓需要登录的页面吗?
当前版本不支持登录态——只能抓公开可访问的 URL。需要登录的页面建议浏览器登录后导出 HTML 文件,或用浏览器自带的截图工具。
输出是哪种格式?体积大吗?
输出是 PNG,无压缩,色彩 / 版式完整保留。长博客 / 长文档的 PNG 可能在几 MB 到几十 MB,归档场景可接受;不接受的话可以再用图片工具压缩。
消耗什么配额?
不消耗 AI 配额,也不消耗「网页获取」额度——本地浏览器渲染。
webapp 端有吗?
当前仅 CLI 提供。webapp 端网页截图能力随产品演进逐步开放。
七、立即体验
# 安装或升级(完整版含 browser 能力)
curl -fsSL https://42md.cc/mac | bash
# 试一下
42md tools screenshot https://your-long-blog.com
系列回顾(系列收尾)
- 第(1)篇:总述
- 第(2)篇:版式优化 lint
- 第(3)篇:AI 翻译 translate
- 第(4)篇:AI 优化 improve
- 第(5)篇:md2pdf Markdown 转 PDF
- 第(6)篇:md2docx Markdown 转 Word
- 第(7)篇:md2epub Markdown 转 EPUB
- 第(8)篇:md2html + md2wechat 双形态 HTML
- 第(9)篇:download 整站资源批量下载
- 第(10)篇:screenshot 网页全页截图(本篇 · 系列收尾)
未来新增工具继续延展。42md tools list 永远是最新清单。
42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。
活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。