42md 知识工具大升级(2)版式优化 lint:让中文 Markdown 更专业
中文 Markdown 的版式细节——半角逗号要不要换全角、中英文要不要加空格、引号是直是弯——每篇手动调太费心。`42md tools lint` 一行命令做完:20 条规则、6 种场景预设(博客 / 公众号 / 书籍 / 字幕转录 / PDF 论文 / 默认),旁写副本或原地修改随你挑,`--check` 模式适合接 git pre-commit。免费,不消耗 AI 配额。
一、为什么要做版式优化
写中文 Markdown 这件事,看起来简单。但你只要稍微讲究一点,就会被一堆小事缠住:
- 半角逗号和全角逗号混着用,看上去乱
- 中英文之间漏了空格,「Markdown的语法」挤成一团
- 行内代码
like_this紧挨着汉字,鼻子贴鼻子 - 一篇里既有
"直引号"又有"弯引号",强迫症受不了 - PDF 论文转完 md 段落断成一截一截,读起来像断片
- 字幕 / 录音转完文字稿带着噪音和怪字符
这些细节一个个手动改要 10 分钟。每写一篇都这么调,时间累起来很可观。
42md tools lint 把这件事变成一行命令:写完一跑,整篇规范化。
二、版式优化的特色
- 20 条规则覆盖中英文间距、标点全角化、省略号统一、列表标记、噪音清理、PDF 拆页断行合并等中文写作高频痛点
- 6 种场景预设——默认 / 博客 / 公众号 / 书籍 / 字幕转录 / PDF 论文,跟你的写作目的对齐
- PDF 论文专属断行合并:
paper预设能把 PDF 拆页留下的碎句重新拼回完整段落,转完直接顺畅阅读 - 字幕转录专属清理:
talk预设专攻语音转录后噪音清理 + 中英混排 + 标点规范,不动 Markdown 结构 - 纯本地处理,免费转换,不调任何外部 AI 服务,高频使用 / 接脚本 / 跑定时任务都行
--check模式不修改文件,适合接到 git pre-commit / CI 流程做版式守门员
三、怎么用 · Webapp
打开 42md.cc 「我的知识库」,找到你要规范的笔记:
- 点笔记顶部「二次处理」下拉 → 选「版式优化」
- 等待几秒处理完成
- 下载副本,或覆盖原文
webapp 端目前跑默认预设(启用全部 20 条规则);多预设选择(博客 / 公众号 / 书籍 / 字幕转录 / PDF 论文)即将上线,届时在前置 Dialog 直接选。当前需要指定预设的场景请用 CLI。
注意事项:版式优化是原文级修改。建议在版本管理工具里(git / 网盘版本历史)保留一份原始版本,方便回滚。
四、怎么用 · CLI
# 旁写副本:生成 essay_lint.md,原文件不动
42md tools lint essay.md
# 原地修改:直接覆盖原文件
42md tools lint essay.md --fix
# 选预设
42md tools lint essay.md --preset wechat # 公众号
42md tools lint essay.md --preset blog # 博客
42md tools lint essay.md --preset book # 书籍(同默认 20 条)
42md tools lint essay.md --preset talk # 字幕 / 录音转录
42md tools lint essay.md --preset paper # PDF 论文
# 只检查不修改(适合 git pre-commit)
42md tools lint essay.md --check
--check 输出例子:
essay.md:12:5: [ZH010] 中文语境用全角标点
essay.md:18:24: [ZH001] 中英文之间加空格
共发现 2 个问题
6 种预设各自对应什么场景:
| 预设 | 适合什么场景 | 关键差异 |
|---|---|---|
default | 写完一篇笔记快速规整 | 启用全部 20 条规则 |
blog | 个人博客 / 公众号草稿 | 跳过 CL001-CL005 清理类规则,保留作者原始风格 |
wechat | 公众号发布前 | 强调全角标点 + 中英文间距 + 噪音清理 |
book | 书籍稿 / 长文集 | 跟 default 一致,全 20 条 |
talk | 字幕稿 / 录音 / 视频转录后 | 专攻语音转录后噪音清理 + 中英混排 + 标点规范;不动 Markdown 结构 |
paper | PDF 论文 / 长文 OCR 后 | 全规则 + CL002「段落断行合并」专治 PDF 拆页留下的碎句 |
小技巧:
- 接到 git pre-commit hook 里:
42md tools lint --check $(git diff --cached --name-only | grep '\.md$')——版式不规范不让提交 - 批量处理整目录:
42md tools lint posts/*.md --fix - 写完一篇后习惯性
lint --fix,省下手动改的精力 - PDF / 长文 OCR 完,紧跟
lint --preset paper --fix,断成一截一截的段落能重新拼回完整段 - 字幕转录完跟
lint --preset talk --fix,怪字符和断行问题一起清
注意事项:
--fix模式会原地覆盖文件,建议先git add一份当前版本再跑,方便回滚- 不同预设的规则集会随版本演进,跑出来不一致时检查 42md 版本
五、实际演示
版式优化的演示样本即将上线——届时会展示一份「博客草稿」公众号预设跑完前后对比。当前可以拿你的笔记 42md tools lint your-essay.md --check 直接看输出。
六、常见问题
会改我的措辞或语义吗?
不会。lint 只动版式层(标点、间距、空格、引号、列表标记、清理噪音、合并断行等结构性内容),不动语义和措辞。要改写措辞请用 AI 优化 improve。
支持哪些预设?规则有多少条?
6 种预设:default / blog / wechat / book / talk / paper。共 20 条规则,每个预设按场景启用其中的一个子集,避免逐个开关的麻烦。
消耗配额吗?
不消耗。lint 是纯本地结构化处理,免费转换,可放心高频使用——加到脚本里、CI 里、定时任务里都行。
能加自定义规则吗?
当前版本规则集内置。自定义规则集后续会通过配置文件方式开放。
原地修改 --fix 失败会破坏原文吗?
不会。lint 用临时文件原子写入再 rename,进程中断只会保留原文或完整新版二选一,不存在「写了一半」的中间状态。
七、立即体验
# 安装或升级
curl -fsSL https://42md.cc/mac | bash
# 试一下
42md tools lint your-essay.md --check # 看看有哪些问题
42md tools lint your-essay.md --fix # 一键修复
或者打开 42md.cc 知识库,每篇笔记顶部「二次处理 → 版式优化」直接调用。
系列回顾
- 第(1)篇:总述
- 第(2)篇:版式优化 lint(本篇)
- 第(3)篇:AI 翻译 translate
- 第(4)篇:AI 优化 improve
- 第(5)篇:md2pdf:Markdown 转 PDF
- 后续:md2docx / md2epub / md2html+wechat / download / screenshot
42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。
活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。