42md 知识编译大升级(5)知识整理:漏合的重复卡,AI 合并成一张
74 张卡片用久了又加几篇文章,偶尔会冒出重复——同一个人在两篇文章里写法差得远,编译当下没认出,各自落了一张卡。打开知识卡片页的「整理」,扫一遍把这类漏合的重复卡挑出来。选一张当主卡,AI 把几张卡的内容综述进主卡、升成新版本,别名和来源都并过去,其余删掉。重复、过时、孤立、事实冲突的卡,都能在这里一处清掉。
知识库用久了,卡片会越攒越多。大部分时候这是好事,但偶尔会冒出重复——同一个人、同一个概念,散成了两张卡。
这次接着用 Paul Graham 这套素材。之前几篇文章拆出 74 张卡片,后来又陆续加了几篇。偶尔会遇到这种情况:同一个人在两篇文章里写法差得远,编译当下没认出是同一个人,于是各自落了一张卡,标题不一样,分着躺在库里。
编译时已经帮你合并了大部分
先说清楚:这种情况不常见。
编译每张卡的时候,42md 会拿它和库里已有的卡比对,认出同一个实体就自动并到一张主卡上,把新写法收进别名。第二篇里的「James Gosling」「Gosling」「詹姆斯·高斯林」,三种写法都归到了同一张卡——这是编译当下就做完的,你根本不用管。
漏网的是少数:两篇文章里的写法差得比较远,或者隔了很久才加进来,编译那一刻没比对上,就各自成了卡。攒到一定量,这些漏合的卡值得清一清。
打开「整理」,扫一遍
打开知识卡片页,右上角点「整理」,再点「立即扫描」。AI 把整个知识库过一遍,按问题类型分组列出来。

别名交叉、却还分着的重复卡,会单独列成「重复卡片」一组。展开就能看到哪几张其实是同一个人或同一个概念——比如一张偏某人在 Viaweb 的角色、一张偏他的学术背景,写法不同,分着躺在库里。
选一张主卡,AI 合并成一张
对确实是同一实体的那组点「合并为一张」。
弹出的对话框里列出要合并的卡,默认勾内容更全的那张当主卡,你也可以改选。下面写明这次大约消耗多少 AI 生成额度(按千字计)。点「开始合并」前先确认一次。
确认后,AI 读这几张卡,把内容综述进主卡——主卡原有的细节保留,其余卡里独有的事实补进来,说法不一致的地方显化标注,写成主卡的新版本。几张卡的别名合到一起,它们牵着的来源文章、关联关系,全部归到主卡名下。其余卡合并完就删掉。
整个过程和「综述」「质检」一样:AI 调用前有二次确认,显示预估消耗,由你点按钮触发。
合并之后
知识库里那个实体只剩一张卡了,版本号升到 v2。
打开它的「版本历史」,v1 是合并前主卡的原始版本,可以点「查看」回溯对照,确认 AI 合得对不对。来源那一栏列着原先分散在几张卡上的出处,现在都挂在这一张上。下次再加新素材提到它,无论用哪种写法,都会归到这张卡。
不止查重
「整理」扫的不只是重复卡。同一次扫描还会标出:来源文章更新后没重新编译的「过时」卡、没有任何关联又只来自单篇文章的「孤立」卡、关键字段空着的卡等等。每一类都列在面板里,按需处理。重复卡的「合并为一张」是其中改动较大的一项,放在了开头。
开始使用
- 打开 42md.cc,进入知识卡片页
- 右上角点「整理」→「立即扫描」
- 展开「重复卡片」,对确实是同一实体的一组点「合并为一张」,选主卡、确认
- 合并完打开主卡的「版本历史」,对照看 AI 合得对不对
知识库越大,越值得隔段时间整理一次。
42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。
活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。