42md 知识编译大升级（5）知识整理：漏合的重复卡，AI 合并成一张

知识库用久了，卡片会越攒越多。大部分时候这是好事，但偶尔会冒出重复——同一个人、同一个概念，散成了两张卡。

这次接着用 Paul Graham 这套素材。之前几篇文章拆出 74 张卡片，后来又陆续加了几篇。偶尔会遇到这种情况：同一个人在两篇文章里写法差得远，编译当下没认出是同一个人，于是各自落了一张卡，标题不一样，分着躺在库里。

编译时已经帮你合并了大部分

先说清楚：这种情况不常见。

编译每张卡的时候，42md 会拿它和库里已有的卡比对，认出同一个实体就自动并到一张主卡上，把新写法收进别名。第二篇里的「James Gosling」「Gosling」「詹姆斯·高斯林」，三种写法都归到了同一张卡——这是编译当下就做完的，你根本不用管。

漏网的是少数：两篇文章里的写法差得比较远，或者隔了很久才加进来，编译那一刻没比对上，就各自成了卡。攒到一定量，这些漏合的卡值得清一清。

打开知识卡片页，右上角点「整理」，再点「立即扫描」。AI 把整个知识库过一遍，按问题类型分组列出来。

知识整理面板：按问题类型分组列出待处理项

别名交叉、却还分着的重复卡，会单独列成「重复卡片」一组。展开就能看到哪几张其实是同一个人或同一个概念——比如一张偏某人在 Viaweb 的角色、一张偏他的学术背景，写法不同，分着躺在库里。

对确实是同一实体的那组点「合并为一张」。

弹出的对话框里列出要合并的卡，默认勾内容更全的那张当主卡，你也可以改选。下面写明这次大约消耗多少 AI 生成额度（按千字计）。点「开始合并」前先确认一次。

确认后，AI 读这几张卡，把内容综述进主卡——主卡原有的细节保留，其余卡里独有的事实补进来，说法不一致的地方显化标注，写成主卡的新版本。几张卡的别名合到一起，它们牵着的来源文章、关联关系，全部归到主卡名下。其余卡合并完就删掉。

整个过程和「综述」「质检」一样：AI 调用前有二次确认，显示预估消耗，由你点按钮触发。

知识库里那个实体只剩一张卡了，版本号升到 v2。

打开它的「版本历史」，v1 是合并前主卡的原始版本，可以点「查看」回溯对照，确认 AI 合得对不对。来源那一栏列着原先分散在几张卡上的出处，现在都挂在这一张上。下次再加新素材提到它，无论用哪种写法，都会归到这张卡。

「整理」扫的不只是重复卡。同一次扫描还会标出：来源文章更新后没重新编译的「过时」卡、没有任何关联又只来自单篇文章的「孤立」卡、关键字段空着的卡等等。每一类都列在面板里，按需处理。重复卡的「合并为一张」是其中改动较大的一项，放在了开头。

知识库越大，越值得隔段时间整理一次。

42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。

活水 AI 实验室（42ailab） — 源自 2023 年成立的活水智能团队，致力于以认知科学为基石，推动人工智能与人类智能的深度融合与科学创新。