42md 知识编译大升级(2)知识卡片:11 种卡片自动提取
挑几篇 Paul Graham 的随笔上传 42md,几分钟后得到 74 张知识卡片:术语卡带定义和举例,人物卡带小传和别名,金句卡带原文和评论。每张卡都有出处可追溯,关联可下钻。
挑了几篇 paulgraham.com 上的随笔上传 42md 编译。Paul Graham 是 Y Combinator 联合创始人,写了二十多年文章,是科技圈影响力很广的随笔作者之一。
几分钟后打开知识卡片库,这几篇文章拆出了 74 张知识卡片:

自动提取 11 种卡片类型
74 张卡不是一团杂乱的 markdown 笔记。它们按《聪明的阅读者》提出的卡片大法,自动归到 11 种类型里,每种有自己的字段:
| 类型 | 关键字段 |
|---|---|
| 基础卡 | 自由格式正文 |
| 行动卡 | 可执行步骤 |
| 新知卡 | 旧认知 / 新认知 / 证据 |
| 术语卡 | 定义 / 原理 / 举例 |
| 人物卡 | 小传 / 主要贡献 / 代表作 / 别名 |
| 图示卡 | 图示结构 / 说明 |
| 事件卡 | 时间 / 行动者 / 地点 / 结果 |
| 金句卡 | 原文 / 出处 / 评论 |
| 新词卡 | 新词 / 原句 / 造句 |
| 索引卡 | 索引类型 / 条目 |
| 综述卡 | 维度 / 分组 / 原卡链接(详见第 3 篇) |
Paul Graham 这几篇文章里的 74 张卡分布是:新知卡 20 张、行动卡 10 张、术语卡 10 张、人物卡 8 张、金句卡 7 张、索引卡 7 张、图示卡 6 张、事件卡 3 张、基础卡 2 张、新词卡 1 张。
打开卡片详情页,按类型渲染对应字段,不再需要自己从一段文字里翻找信息。
整个卡片库的全局视图也按类型分类——左侧侧边栏一眼能看到全库的结构分布:

每种类型长什么样?看两张就懂了。
一张金句卡:原文 + 评论 + 出处
Paul Graham 在《Java's Cover》(Java 的封面)里写过一句话:「历史上,为别人设计的语言都很糟糕:Cobol, PL/I, Pascal, Ada, C++。而那些伟大的语言,都是为创造者自己设计的:C, Perl, Smalltalk, Lisp。」
这句话被自动识别为一张金句卡,标题取得很准——「为平庸者设计的语言注定失败」:

金句卡的字段是固定的:原文逐字保留 Paul Graham 的英文原句;评论是 AI 帮你做的中文解读——「这句话揭示了技术产品设计的核心:当设计者降低门槛以适应大众时,往往牺牲了灵活性和创造力,导致工具变得笨重且缺乏生命力」;来源指明这句出自哪篇文章哪个段落(《Java 的封面》第 2 点);关联卡片串起 Paul Graham 在其他文章里相关的论点(「黑客富二代:通过封面预判技术……」)。
你不需要自己回到原文里翻——所有上下文 42md 都帮你串好了。
一张术语卡:定义 + 解释 + 举例 + 关联
Paul Graham 在《Being Popular》(大众化)里区分了两种语言演化路径:「organic growth」(有机增长)和「big bang」(大爆炸式发布)。这是一个能反复用的概念,被识别为术语卡:

术语卡的字段更厚:定义保留 Paul Graham 的英文原文("The organic growth method is exemplified by the classic seat-of-the-pants underfunded garage startup...");解释是中文阐述(「有机增长模式允许早期采用者帮助发现并修复技术缺陷……」);举例给出具体例子(Unix 和 MacLisp 是有机增长的代表,Multics 和 Common Lisp 是大爆炸的代表);来源精确到论文章节(《大众化》第 9 部分 'Time');关联卡片用「反对」「支持」标签把这个术语和库里其他卡串起来——这张「有机增长 vs 大爆炸式发布」反对了「Common Lisp 的……」,支持了「语言的生命周……」。
每张卡都连着其他卡——有出处可追溯,有关联可下钻。
同一个人,自动合并到一张主卡
Paul Graham 在不同文章里反复提到 James Gosling(Java 之父)。有的文章里写 James Gosling,有的写 Gosling,有的写「詹姆斯·高斯林」——三种写法,都是同一个人。
42md 编译入库前会做两件事:用全文检索把候选标题和已有卡的别名都搜一遍,召回相似的人物卡;召回到了再调一次 LLM 判定是不是同一个实体。是的话合并到同一张主卡,把别名累积进 aliases 字段。
你在卡片库里看到的就是一张 James Gosling 人物卡,aliases 写着「Gosling / 詹姆斯·高斯林 / James Gosling」。下次任何素材里再提到他,无论用哪种写法,都会归到这张卡。
同一张卡,越读越厚
读 Paul Graham 第一波文章时积累了 James Gosling 的小传。两个月后你又抓了几篇关于早期 Java 设计史的文章,里面新提到 Gosling 在 Sun 公司的创办经历——这是新事实。
42md 会做版本综合:AI 读上一版的所有字段 + 新素材产出的字段,合成新版本,原本有的细节继续保留,新增的事实加进去,说法不一致的地方显化标注。
旧版本在卡片详情页的「历史版本」下拉里只读保留——你随时可以对比一年前这张卡长什么样、现在长什么样。
想试试
打开 42md.cc,挑几篇你想认真读的文章上传或抓取。几十秒后进入「知识卡片」,看 AI 给你产出了哪 11 种卡、每张卡的字段长什么样、关联卡片把哪些事串到了一起。
查看详情:42md 知识编译大升级(3)知识综述:让 AI 把多张相关卡综述成一张
42md — 你的 AI 知识编译器。更快的知识获取,更深的知识编译,更好的知识策展。
活水 AI 实验室(42ailab) — 源自 2023 年成立的活水智能团队,致力于以认知科学为基石,推动人工智能与人类智能的深度融合与科学创新。