arxiv 论文直读:一个链接进去,标题作者年份都给你填好
读一篇 arxiv 论文,过去要先找到 PDF、下载、再转 Markdown,转完还得自己回去补标题、作者、发表年份。现在一个 arxiv 链接丢进 42md 就够了:自动取全文 PDF、转成干净 Markdown,还顺手把标题、作者、年份、DOI 这些信息写进文首,方便归档检索。接着翻译、提炼术语、出摘要,或者交给一条编排一气呵成。其他学术站点的 PDF 链接同样能直接读。
读一篇 arxiv 论文,过去这条路有点绕:先打开摘要页,找到 PDF 链接,下载,再转成 Markdown;转完一看,文首空空,标题、作者、哪年发的,还得自己回去一个个补上。
现在,一个链接的事。
一个 arxiv 链接,直接读全文
不管你手上的是摘要页、HTML 页还是 PDF 页,把链接丢给 42md 就行,它会自动定位到全文 PDF 读进来:
42md https://arxiv.org/abs/1706.03762 # 摘要页链接,照样能读
42md https://arxiv.org/pdf/1706.03762 # PDF 链接,也行
不用你先点进去找 PDF、再复制下载链接。取下来、转成干净的 Markdown,一步到位。
标题、作者、年份,自动写进文首
更省事的是元数据。论文转成 Markdown 后,42md 会去查这篇论文的基本信息,写进文件开头的 frontmatter:
---
title: "Attention Is All You Need"
source: "pdf"
source_url: "https://arxiv.org/abs/1706.03762"
created: "2026-08-15T10:30:00Z"
authors:
- "Ashish Vaswani"
- "Noam Shazeer"
- "Niki Parmar"
year: 2017
---
标题、作者、发表年份都给你填好。要是这篇论文已在期刊正式发表、登记过 DOI,还会一并带上 doi 和 journal 两行(纯预印本没有期刊 DOI,就不写)。这一段信息让每篇论文落到你知识库里时,天然就是「可归档、可检索」的状态——按作者找、按年份排、引用时直接抄,不用再手敲。查不到信息时它静默跳过,不会因为补不全就让整篇转换失败。
其他学术站点的论文也能读:任意以
读进来之后,接着做的事
论文进了知识库,才是开始。42md 的二次处理直接接上:
- 翻译——英文论文一键转中文速读:
42md tools translate paper.md --target 中文 - 提炼术语——把论文里的关键术语、缩写收成一份词表:
42md tools hotwords paper.md - 出摘要——研究问题 / 方法 / 发现 / 创新 / 术语 / 局限六节结构化拆解,精读前先摸清全貌:
42md tools summarize paper.md
每一步都是独立命令,按你的需要挑;想把论文进一步拆成知识卡片沉淀,到网页知识库里接着做。
或者,一条编排一气呵成
要是你每篇论文都走同一套——读进来、翻成中文、再出一份摘要——那就别一条条敲了,内置编排 pdf2digest 一次跑完:
42md recipe run pdf2digest https://arxiv.org/abs/2506.06191
它替你接好三步:取 PDF 转 Markdown、翻译成中文、提炼要点摘要。英文原文、中文译文、中文摘要三份都留着,方便对照。含 AI 步骤的,开跑前会把预估消耗列给你看,按确认才走。
想自己组一套不一样的流程,或者让 AI 帮你生成一条,可以看知识编排系列。
立即体验
# 安装或升级
curl -fsSL https://42md.cc/mac | bash
# 读一篇 arxiv 论文
42md https://arxiv.org/abs/1706.03762
一个链接进去,一篇带好标题作者的 Markdown 出来——这就是 42md 的「更快地获取」。
42md — 你的知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。
活水 AI 实验室(42ailab) — 探索智能边界的 AI 创新实验室,以认知科学为基石,推动 AI 与人类智能的深度融合,真正理解并增强智能 —— 碳基的,也是硅基的。