跳转到主内容
版本发布

arxiv 论文直读:一个链接进去,标题作者年份都给你填好

读一篇 arxiv 论文,过去要先找到 PDF、下载、再转 Markdown,转完还得自己回去补标题、作者、发表年份。现在一个 arxiv 链接丢进 42md 就够了:自动取全文 PDF、转成干净 Markdown,还顺手把标题、作者、年份、DOI 这些信息写进文首,方便归档检索。接着翻译、提炼术语、出摘要,或者交给一条编排一气呵成。其他学术站点的 PDF 链接同样能直接读。

5 分钟
产品发布学术论文arxiv元数据知识获取

读一篇 arxiv 论文,过去这条路有点绕:先打开摘要页,找到 PDF 链接,下载,再转成 Markdown;转完一看,文首空空,标题、作者、哪年发的,还得自己回去一个个补上。

现在,一个链接的事。

一个 arxiv 链接,直接读全文

不管你手上的是摘要页、HTML 页还是 PDF 页,把链接丢给 42md 就行,它会自动定位到全文 PDF 读进来:

42md https://arxiv.org/abs/1706.03762      # 摘要页链接,照样能读
42md https://arxiv.org/pdf/1706.03762      # PDF 链接,也行

不用你先点进去找 PDF、再复制下载链接。取下来、转成干净的 Markdown,一步到位。

标题、作者、年份,自动写进文首

更省事的是元数据。论文转成 Markdown 后,42md 会去查这篇论文的基本信息,写进文件开头的 frontmatter:

---
title: "Attention Is All You Need"
source: "pdf"
source_url: "https://arxiv.org/abs/1706.03762"
created: "2026-08-15T10:30:00Z"
authors:
  - "Ashish Vaswani"
  - "Noam Shazeer"
  - "Niki Parmar"
year: 2017
---

标题、作者、发表年份都给你填好。要是这篇论文已在期刊正式发表、登记过 DOI,还会一并带上 doijournal 两行(纯预印本没有期刊 DOI,就不写)。这一段信息让每篇论文落到你知识库里时,天然就是「可归档、可检索」的状态——按作者找、按年份排、引用时直接抄,不用再手敲。查不到信息时它静默跳过,不会因为补不全就让整篇转换失败。

其他学术站点的论文也能读:任意以 .pdf 结尾的论文链接,42md 都能直接取下来转成 Markdown。自动补全标题、作者这一段,当前主要覆盖 arxiv。

读进来之后,接着做的事

论文进了知识库,才是开始。42md 的二次处理直接接上:

  • 翻译——英文论文一键转中文速读:42md tools translate paper.md --target 中文
  • 提炼术语——把论文里的关键术语、缩写收成一份词表:42md tools hotwords paper.md
  • 出摘要——研究问题 / 方法 / 发现 / 创新 / 术语 / 局限六节结构化拆解,精读前先摸清全貌:42md tools summarize paper.md

每一步都是独立命令,按你的需要挑;想把论文进一步拆成知识卡片沉淀,到网页知识库里接着做。

或者,一条编排一气呵成

要是你每篇论文都走同一套——读进来、翻成中文、再出一份摘要——那就别一条条敲了,内置编排 pdf2digest 一次跑完:

42md recipe run pdf2digest https://arxiv.org/abs/2506.06191

它替你接好三步:取 PDF 转 Markdown、翻译成中文、提炼要点摘要。英文原文、中文译文、中文摘要三份都留着,方便对照。含 AI 步骤的,开跑前会把预估消耗列给你看,按确认才走。

想自己组一套不一样的流程,或者让 AI 帮你生成一条,可以看知识编排系列

立即体验

# 安装或升级
curl -fsSL https://42md.cc/mac | bash

# 读一篇 arxiv 论文
42md https://arxiv.org/abs/1706.03762

一个链接进去,一篇带好标题作者的 Markdown 出来——这就是 42md 的「更快地获取」。


42md — 你的知识快刀。更快地获取、更深地编译、更好地策展、更强的工具。

活水 AI 实验室(42ailab) — 探索智能边界的 AI 创新实验室,以认知科学为基石,推动 AI 与人类智能的深度融合,真正理解并增强智能 —— 碳基的,也是硅基的。

官网https://42md.cc