跳转到主内容
版本发布

42md 知识工具大升级(11)合并与拆分:长文拆得开,碎片并得拢

十几篇会议纪要想合成一份周报,一本几百页的书稿想按章拆开分别翻译——以前都得手动复制粘贴。42md 新增 merge 与拆分两个工具,多份 Markdown 一条命令并成一份,一份长文按标题自动拆成多份,每份还带着上层标题,单独拿去转 Word、翻译都不丢上下文。免费,不消耗 AI 配额。

8 分钟
产品发布合并拆分Markdown 整理长文处理

一、为什么要做合并与拆分

写作和整理 Markdown 时,有两类反复出现的体力活:

  • 一周攒了十几份会议纪要 / 读书笔记,想合成一份周报或一本合集,只能一份份打开复制粘贴。
  • 一份几百页的书稿、长报告想按章节拆开,分别交给不同的人校对,或分别翻译、分别转成 Word,手动切分容易切错地方。
  • 用 42md 把一本超大 PDF 转成 Markdown 后,想按章节分块再加工,却没有顺手的切分工具。
  • 拆出来的片段往往丢了上层标题,单独拿去转格式或翻译时,AI 不知道这段属于哪一章。

这些都是纯粹的「文本整理」,不该占用人的时间。42md 新增 merge(合并)和 split(拆分)两个工具,把这件事变成一条命令。

二、合并与拆分的特色

  • 一条命令并拢或拆开——merge 把多份 Markdown 按你给的顺序拼成一份;split 把一份长文拆成多份,互为逆向操作。
  • 拆分自动看文档结构——不必每次指定层级:文档里有多个一级标题就按章拆,只有一个总标题、底下多个小节就按节拆;也可以手动指定按几级标题拆。
  • 每份自带上层标题——按小节拆时,每个产物都带着书名 / 章节标题,单独拿去转 Word、转 EPUB、翻译时都有完整上下文。
  • 合并即分页——合并后的文件在文件衔接处自动留出分页,转成 PDF / Word 时每份原文各起一页,并标注来源文件名,方便回溯。
  • 纯本地处理,免费——不调任何外部 AI 服务,不消耗 AI 配额;页码 / 层级超出范围会直接报错,不会悄悄截断。

三、怎么用 · Webapp

合并与拆分目前以命令行为主,Webapp 端入口随产品演进逐步开放。网页用户当前可以先用「下载为更多格式」把笔记导出成 Markdown,再到命令行做合并 / 拆分。

四、怎么用 · CLI

合并多份 Markdown:

# 多份合成一份(按命令行给的顺序)
42md tools merge chapter-01.md chapter-02.md chapter-03.md -o book.md

# 也可以用通配符或直接给目录
42md tools merge chapters/*.md -o book.md
42md tools merge chapters/ -o book.md

拆分一份长文:

# 默认自动判断层级:多个一级标题→按章拆;单标题多小节→按节拆
42md tools split book.md

# 指定按二级标题拆,产物放到 out/ 目录
42md tools split book.md --level 2 -o out/

# 按分页拆:还原 PDF 转换 / 合并时留下的分页
42md tools split book.md --by pagebreak

小技巧:

  • 合并与拆分能接力组合。一本超大 PDF 转成 Markdown 后,先 split 按章拆开,分别翻译 / 校对,再 merge 拼回完整一份。
  • 超大 PDF 的 AI 识别单次有页数上限时,可以分段识别后用 merge 合回(见上一篇「PDF 页码范围」相关说明)。

注意事项:

  • 拆分产物默认按「序号 + 标题」命名(如 book-01-引言.md),与输入同目录或 -o 指定的目录;同名自动追加 _1 / _2 防覆盖。
  • 合并时多份文件各自的元信息(frontmatter)会归并到产物开头;指定页码 / 层级超出文档范围会直接提示,不会静默丢内容。

五、实际演示

一份带书名和多个章节的长文,按章拆开再拼回的效果:

$ 42md tools split 认知写作课.md -o parts/
拆分 认知写作课.md → 4 块
  parts/认知写作课-01.md
  parts/认知写作课-02-为什么写作.md
  parts/认知写作课-03-怎么开始.md
  parts/认知写作课-04-刻意练习.md

$ 42md tools merge parts/*.md -o 合订本.md
已合并 4 个文件 → 合订本.md

拆出的每份都保留了书名作为上层标题,单独打开就是一篇完整可读、可直接转 Word 或翻译的文档。

六、常见问题

合并时文件顺序怎么定?

按你在命令里写的先后顺序拼接。用通配符或目录时按文件名排序,建议用 01- / 02- 前缀控制顺序。

不指定层级时,拆分按几级标题?

会先看文档结构:有多个一级标题就按一级(章)拆;只有一个总标题、底下多个二级标题就按二级(节)拆。想固定层级时加 --level 1--level 6

拆出来的每一份会丢上下文吗?

不会。按小节拆时,每份都会带上所属的书名 / 章节标题,单独拿去转格式或翻译都有完整上下文。

能把一份转出来的 PDF 笔记按页还原成多份吗?

可以。42md tools split book.md --by pagebreak 会按分页把文档拆开,常用于还原 PDF 转换或 merge 之前的分段。

会消耗 AI 配额吗?

不会。合并与拆分都是本地文本整理,免费,不调任何外部 AI 服务。

页码 / 层级写错了会怎样?

会直接报错并提示(比如「文档共 N 页,超出范围」),不会悄悄截断或产出空文件,方便你当场改对。

七、立即体验

# 安装 / 更新
curl -fsSL https://42md.cc/mac | bash

# 合并
42md tools merge a.md b.md c.md -o book.md
# 拆分
42md tools split book.md

系列回顾


42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。

活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。

官网https://42md.cc