42md 知识工具大升级(12)inspect 与 compress:大文件先体检,再一键瘦身
一份贴满截图的 Keynote 攒到 200 MB,一个扫描版 PDF 一百多兆,想发邮件、传网盘、转成 Markdown 之前先压一压,可压缩软件要么得另装一堆工具,要么把画质压花。42md 新增 inspect 和 compress 两个工具:先用 inspect 给源文件做体检,看清体积都堆在哪、哪些能压、哪些是视频压不动,心里有数再动手;compress 一条命令瘦身,PDF、图片、Keynote 常能压到原来的几分之一。纯本地处理,不上传文件、不装额外软件、不消耗 AI 配额。
一、为什么要做 inspect 与 compress
整理知识素材时,源文件越攒越大是常事:
- 一份做了几十页的 Keynote,从网页、论文里一张张截图粘进去,不知不觉就两三百兆,发邮件超限、传网盘半天。
- 从扫描件、PPT 导出的 PDF 动辄一百多兆,丢进 42md 转 Markdown 前,光上传就等很久。
- 想压一压,常见的压缩软件要么得先装一堆命令行工具,要么一压就把图压花,分不清「该压的」和「不能动的」。
- 更麻烦的是不知道体积到底堆在哪——是几张超大无损图,还是一段嵌进去的视频?盲压一通,效果还看不清。
这些都是动手前心里没底造成的反复折腾。42md tools inspect 先给源文件做一次体检,42md tools compress 再按体检结果瘦身,把「看清楚」和「压下去」拆成两步。
二、inspect 与 compress 的特色
- 先体检,再动手——
inspect把体积按类别拆开摆给你看:多少兆是无损大图(能压)、多少兆已经是高效编码(保留)、多少兆是视频(压不动),还给出一个保守的可瘦身预估,压之前就知道大概能省多少。 - 一条命令压到几分之一——
compress把以无损格式塞进去的大图重新编码成更省体积的形式,PDF、图片、Keynote 都支持,日常阅读和投影的观感基本一致,体积却能降到原来的几分之一。 - 视频如实告知,不画饼——Keynote 里嵌的视频本身已是高效编码,本地动不了;
inspect会把这部分单独标出来,compress原样保留,不会让你误以为「压完还能更小」。 - 纯本地、免费、零依赖——文件不上传、不经过任何外部服务,也不用额外安装别的压缩工具,装好 42md 就能用,不消耗 AI 配额。
- 不瞎压、不毁原件——已经是高效编码、压了也不会更小时,直接提示「无可压空间」并保持原文件不动;产物默认另存为新文件,原件始终在。
三、怎么用 · Webapp
inspect 与 compress 目前以命令行为主,网页端入口随产品演进逐步开放。网页用户当前可以先在「我的知识库」里完成转换与导出,源文件的体检与瘦身放到命令行来做。
四、怎么用 · CLI
先体检,看清体积构成:
# 体检一个源文件(PDF / 图片 / Keynote)
42md tools inspect 讲座.key
42md tools inspect 扫描合同.pdf
# 给脚本用的 JSON 输出
42md tools inspect 讲座.key --json
再瘦身:
# 一键瘦身,产物默认存成 <名>_compressed.<后缀>,原件不动
42md tools compress 讲座.key
42md tools compress 扫描合同.pdf
# 指定输出路径
42md tools compress 扫描合同.pdf -o out/合同-small.pdf
# PDF 可调画质(0-100,默认 50,数值越高越清晰、体积越大)
42md tools compress 扫描合同.pdf --quality 70
小技巧:
- 养成「先
inspect再compress」的习惯——体检报告里若大头是视频,就知道这份文件压缩空间有限,不必白忙一场。 - 转 Markdown 前先压一遍超大 PDF,上传更快;图片素材批量转成更省体积的格式(WebP),网页 / 电子书带图也更轻。
注意事项:
- 产物默认另存为新文件(PDF / Keynote 加
_compressed后缀,图片转.webp),同名会自动改名,不会覆盖原件。 - 已是高效编码、压了也不会更小的文件,会直接提示并保持原样,不产出更大的「假压缩」文件。
五、实际演示
一份贴满截图的 Keynote,先体检再瘦身:
$ 42md tools inspect 直播.key
直播.key [keynote] 203.0 MB
93 页幻灯片
体积构成:
108.5 MB ×223 png (栅格图·可压) ✓可压
87.8 MB ×14 tiff (栅格图·可压) ✓可压
2.7 MB ×96 jpg (栅格图·可压) ✓可压
2.1 MB ×19 jpeg (栅格图·可压) ✓可压
1.2 MB ×5 pdf (PDF·可压) ✓可压
预估可瘦身约 168.3 MB → ~34.7 MB(compress 实际为准)
$ 42md tools compress 直播.key
✓ 已瘦身 203.0 MB → 36.1 MB(重编码 123 张图,视频原样保留):直播_compressed.key
同一场直播导出的扫描版 PDF:
$ 42md tools inspect 直播.pdf
直播.pdf [pdf] 124.1 MB
93 页
体积构成:
111.7 MB ×101 FlateDecode 可压
7.2 MB ×66 FlateDecode 已是高效编码/不支持 ·保留
2.4 MB ×10 DCTDecode 已是高效编码/不支持 ·保留
预估可瘦身约 95.0 MB → ~29.1 MB(compress 实际为准)
$ 42md tools compress 直播.pdf
✓ 已瘦身 124.1 MB → 17.1 MB(重压 141 张图):直播_compressed.pdf
体检报告先把「能压的无损大图」和「已是高效编码、留着不动的部分」分开列清楚,瘦身后 203 MB 的 Keynote 降到 36 MB,124 MB 的 PDF 降到 17 MB,发邮件、传网盘、转 Markdown 都轻快不少。
六、常见问题
会把我的文件上传到服务器吗?
不会。inspect 和 compress 都在本地处理,文件不离开你的电脑,也不消耗 AI 配额。
压缩会损坏原文件吗?
不会。产物默认另存为新文件(加 _compressed 后缀或转 .webp),原件始终保留,同名还会自动改名防覆盖。
支持哪些文件?
目前支持 PDF、常见图片,以及 Keynote(.key)。其它格式会直接提示暂不支持。
视频为什么压不了?
Keynote 里嵌的视频本身已经是高效编码,本地重压收益很低,所以原样保留。inspect 会把视频占了多少单独告诉你,方便判断这份文件值不值得压。
画质会差很多吗?
compress 是把以无损格式塞进去的大图重新编码成更省体积的形式,日常阅读、投影的观感基本一致。PDF 还能用 --quality 调,数值越高越清晰、体积越大。
本来就很小、压不动的文件会怎样?
会提示「已是高效编码,无可压空间」,并保持原文件不动,不会产出一个更大的「假压缩」文件。
七、立即体验
# 安装 / 更新
curl -fsSL https://42md.cc/mac | bash
# 先体检
42md tools inspect 你的文件.key
# 再瘦身
42md tools compress 你的文件.key
系列回顾
- 第(1)篇:知识工具总述
- 第(2)篇:版式优化 lint
- 第(3)篇:AI 翻译 translate
- 第(4)篇:AI 优化 improve
- 第(5)篇:md2pdf 专业级 PDF
- 第(6)篇:md2docx Markdown 转 Word
- 第(7)篇:md2epub Markdown 转 EPUB
- 第(8)篇:md2html + md2wechat 双形态 HTML
- 第(9)篇:download 整站资源批量下载
- 第(10)篇:screenshot 网页全页截图
- 第(11)篇:合并与拆分 merge / split
- 第(12)篇:inspect 与 compress(本篇)
42md — 你的知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。
活水 AI 实验室(42ailab) — 探索智能边界的 AI 创新实验室,以认知科学为基石,推动 AI 与人类智能的深度融合,真正理解并增强智能 —— 碳基的,也是硅基的。