跳转到主内容
版本发布

42md 知识编译大升级(5)知识整理:漏合的重复卡,AI 合并成一张

74 张卡片用久了又加几篇文章,偶尔会冒出重复——同一个人在两篇文章里写法差得远,编译当下没认出,各自落了一张卡。打开知识卡片页的「整理」,扫一遍把这类漏合的重复卡挑出来。选一张当主卡,AI 把几张卡的内容综述进主卡、升成新版本,别名和来源都并过去,其余删掉。重复、过时、孤立、事实冲突的卡,都能在这里一处清掉。

6 分钟
功能发布知识编译知识整理

知识库用久了,卡片会越攒越多。大部分时候这是好事,但偶尔会冒出重复——同一个人、同一个概念,散成了两张卡。

这次接着用 Paul Graham 这套素材。之前几篇文章拆出 74 张卡片,后来又陆续加了几篇。偶尔会遇到这种情况:同一个人在两篇文章里写法差得远,编译当下没认出是同一个人,于是各自落了一张卡,标题不一样,分着躺在库里。

编译时已经帮你合并了大部分

先说清楚:这种情况不常见。

编译每张卡的时候,42md 会拿它和库里已有的卡比对,认出同一个实体就自动并到一张主卡上,把新写法收进别名。第二篇里的「James Gosling」「Gosling」「詹姆斯·高斯林」,三种写法都归到了同一张卡——这是编译当下就做完的,你根本不用管。

漏网的是少数:两篇文章里的写法差得比较远,或者隔了很久才加进来,编译那一刻没比对上,就各自成了卡。攒到一定量,这些漏合的卡值得清一清。

打开「整理」,扫一遍

打开知识卡片页,右上角点「整理」,再点「立即扫描」。AI 把整个知识库过一遍,按问题类型分组列出来。

知识整理面板:按问题类型分组列出待处理项

别名交叉、却还分着的重复卡,会单独列成「重复卡片」一组。展开就能看到哪几张其实是同一个人或同一个概念——比如一张偏某人在 Viaweb 的角色、一张偏他的学术背景,写法不同,分着躺在库里。

选一张主卡,AI 合并成一张

对确实是同一实体的那组点「合并为一张」。

弹出的对话框里列出要合并的卡,默认勾内容更全的那张当主卡,你也可以改选。下面写明这次大约消耗多少 AI 生成额度(按千字计)。点「开始合并」前先确认一次。

确认后,AI 读这几张卡,把内容综述进主卡——主卡原有的细节保留,其余卡里独有的事实补进来,说法不一致的地方显化标注,写成主卡的新版本。几张卡的别名合到一起,它们牵着的来源文章、关联关系,全部归到主卡名下。其余卡合并完就删掉。

整个过程和「综述」「质检」一样:AI 调用前有二次确认,显示预估消耗,由你点按钮触发。

合并之后

知识库里那个实体只剩一张卡了,版本号升到 v2。

打开它的「版本历史」,v1 是合并前主卡的原始版本,可以点「查看」回溯对照,确认 AI 合得对不对。来源那一栏列着原先分散在几张卡上的出处,现在都挂在这一张上。下次再加新素材提到它,无论用哪种写法,都会归到这张卡。

不止查重

「整理」扫的不只是重复卡。同一次扫描还会标出:来源文章更新后没重新编译的「过时」卡、没有任何关联又只来自单篇文章的「孤立」卡、关键字段空着的卡等等。每一类都列在面板里,按需处理。重复卡的「合并为一张」是其中改动较大的一项,放在了开头。

开始使用

  1. 打开 42md.cc,进入知识卡片页
  2. 右上角点「整理」→「立即扫描」
  3. 展开「重复卡片」,对确实是同一实体的一组点「合并为一张」,选主卡、确认
  4. 合并完打开主卡的「版本历史」,对照看 AI 合得对不对

知识库越大,越值得隔段时间整理一次。


42md — 你的 AI 知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。

活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。

官网https://42md.cc