跳转到主内容
版本发布

42md 知识工具大升级(12)inspect 与 compress:大文件先体检,再一键瘦身

一份贴满截图的 Keynote 攒到 200 MB,一个扫描版 PDF 一百多兆,想发邮件、传网盘、转成 Markdown 之前先压一压,可压缩软件要么得另装一堆工具,要么把画质压花。42md 新增 inspect 和 compress 两个工具:先用 inspect 给源文件做体检,看清体积都堆在哪、哪些能压、哪些是视频压不动,心里有数再动手;compress 一条命令瘦身,PDF、图片、Keynote 常能压到原来的几分之一。纯本地处理,不上传文件、不装额外软件、不消耗 AI 配额。

10 分钟
产品发布文件瘦身体积优化KeynotePDF

一、为什么要做 inspect 与 compress

整理知识素材时,源文件越攒越大是常事:

  • 一份做了几十页的 Keynote,从网页、论文里一张张截图粘进去,不知不觉就两三百兆,发邮件超限、传网盘半天。
  • 从扫描件、PPT 导出的 PDF 动辄一百多兆,丢进 42md 转 Markdown 前,光上传就等很久。
  • 想压一压,常见的压缩软件要么得先装一堆命令行工具,要么一压就把图压花,分不清「该压的」和「不能动的」。
  • 更麻烦的是不知道体积到底堆在哪——是几张超大无损图,还是一段嵌进去的视频?盲压一通,效果还看不清。

这些都是动手前心里没底造成的反复折腾。42md tools inspect 先给源文件做一次体检,42md tools compress 再按体检结果瘦身,把「看清楚」和「压下去」拆成两步。

二、inspect 与 compress 的特色

  • 先体检,再动手——inspect 把体积按类别拆开摆给你看:多少兆是无损大图(能压)、多少兆已经是高效编码(保留)、多少兆是视频(压不动),还给出一个保守的可瘦身预估,压之前就知道大概能省多少。
  • 一条命令压到几分之一——compress 把以无损格式塞进去的大图重新编码成更省体积的形式,PDF、图片、Keynote 都支持,日常阅读和投影的观感基本一致,体积却能降到原来的几分之一。
  • 视频如实告知,不画饼——Keynote 里嵌的视频本身已是高效编码,本地动不了;inspect 会把这部分单独标出来,compress 原样保留,不会让你误以为「压完还能更小」。
  • 纯本地、免费、零依赖——文件不上传、不经过任何外部服务,也不用额外安装别的压缩工具,装好 42md 就能用,不消耗 AI 配额。
  • 不瞎压、不毁原件——已经是高效编码、压了也不会更小时,直接提示「无可压空间」并保持原文件不动;产物默认另存为新文件,原件始终在。

三、怎么用 · Webapp

inspect 与 compress 目前以命令行为主,网页端入口随产品演进逐步开放。网页用户当前可以先在「我的知识库」里完成转换与导出,源文件的体检与瘦身放到命令行来做。

四、怎么用 · CLI

先体检,看清体积构成:

# 体检一个源文件(PDF / 图片 / Keynote)
42md tools inspect 讲座.key
42md tools inspect 扫描合同.pdf

# 给脚本用的 JSON 输出
42md tools inspect 讲座.key --json

再瘦身:

# 一键瘦身,产物默认存成 <名>_compressed.<后缀>,原件不动
42md tools compress 讲座.key
42md tools compress 扫描合同.pdf

# 指定输出路径
42md tools compress 扫描合同.pdf -o out/合同-small.pdf

# PDF 可调画质(0-100,默认 50,数值越高越清晰、体积越大)
42md tools compress 扫描合同.pdf --quality 70

小技巧:

  • 养成「先 inspectcompress」的习惯——体检报告里若大头是视频,就知道这份文件压缩空间有限,不必白忙一场。
  • 转 Markdown 前先压一遍超大 PDF,上传更快;图片素材批量转成更省体积的格式(WebP),网页 / 电子书带图也更轻。

注意事项:

  • 产物默认另存为新文件(PDF / Keynote 加 _compressed 后缀,图片转 .webp),同名会自动改名,不会覆盖原件。
  • 已是高效编码、压了也不会更小的文件,会直接提示并保持原样,不产出更大的「假压缩」文件。

五、实际演示

一份贴满截图的 Keynote,先体检再瘦身:

$ 42md tools inspect 直播.key
直播.key  [keynote]  203.0 MB
  93 页幻灯片
  体积构成:
      108.5 MB  ×223 png  (栅格图·可压)          ✓可压
       87.8 MB  ×14  tiff  (栅格图·可压)         ✓可压
        2.7 MB  ×96  jpg  (栅格图·可压)          ✓可压
        2.1 MB  ×19  jpeg  (栅格图·可压)         ✓可压
        1.2 MB  ×5   pdf  (PDF·可压)             ✓可压
  预估可瘦身约 168.3 MB → ~34.7 MB(compress 实际为准)

$ 42md tools compress 直播.key
✓ 已瘦身 203.0 MB → 36.1 MB(重编码 123 张图,视频原样保留):直播_compressed.key

同一场直播导出的扫描版 PDF:

$ 42md tools inspect 直播.pdf
直播.pdf  [pdf]  124.1 MB
  93 页
  体积构成:
      111.7 MB  ×101 FlateDecode 可压
        7.2 MB  ×66  FlateDecode 已是高效编码/不支持   ·保留
        2.4 MB  ×10  DCTDecode 已是高效编码/不支持     ·保留
  预估可瘦身约 95.0 MB → ~29.1 MB(compress 实际为准)

$ 42md tools compress 直播.pdf
✓ 已瘦身 124.1 MB → 17.1 MB(重压 141 张图):直播_compressed.pdf

体检报告先把「能压的无损大图」和「已是高效编码、留着不动的部分」分开列清楚,瘦身后 203 MB 的 Keynote 降到 36 MB,124 MB 的 PDF 降到 17 MB,发邮件、传网盘、转 Markdown 都轻快不少。

六、常见问题

会把我的文件上传到服务器吗?

不会。inspect 和 compress 都在本地处理,文件不离开你的电脑,也不消耗 AI 配额。

压缩会损坏原文件吗?

不会。产物默认另存为新文件(加 _compressed 后缀或转 .webp),原件始终保留,同名还会自动改名防覆盖。

支持哪些文件?

目前支持 PDF、常见图片,以及 Keynote(.key)。其它格式会直接提示暂不支持。

视频为什么压不了?

Keynote 里嵌的视频本身已经是高效编码,本地重压收益很低,所以原样保留。inspect 会把视频占了多少单独告诉你,方便判断这份文件值不值得压。

画质会差很多吗?

compress 是把以无损格式塞进去的大图重新编码成更省体积的形式,日常阅读、投影的观感基本一致。PDF 还能用 --quality 调,数值越高越清晰、体积越大。

本来就很小、压不动的文件会怎样?

会提示「已是高效编码,无可压空间」,并保持原文件不动,不会产出一个更大的「假压缩」文件。

七、立即体验

# 安装 / 更新
curl -fsSL https://42md.cc/mac | bash

# 先体检
42md tools inspect 你的文件.key
# 再瘦身
42md tools compress 你的文件.key

系列回顾


42md — 你的知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。

活水 AI 实验室(42ailab) — 探索智能边界的 AI 创新实验室,以认知科学为基石,推动 AI 与人类智能的深度融合,真正理解并增强智能 —— 碳基的,也是硅基的。

官网https://42md.cc