跳转到主内容

扫描件 PDF · AI OCR 识别

没有文字层的扫描件 / 拍照 PDF · AI 视觉识别还原内容

AI 视觉识别
调用大模型视觉理解,比传统 OCR 准确得多
版式保留
段落、列表、表格、标题层级都能识别还原
速度可观
3 页论文秒出干净 Markdown
AI 配额
按页计费 · 调用前 Dialog 显示预估 + 二次确认

立即试一试

下面这个 demo 是把 Attention Is All You Need 论文前 3 页渲染成图像后重新合成的扫描件 PDF, 没有任何文字层。点击「立即转换」可以看到 42md 用 AI 视觉模型把它还原成完整 Markdown。

扫描件 PDF · AI 识别演示

3 页图像化扫描 PDF · 秒级 OCR · 含全部作者、邮箱、章节

什么时候你会需要这个

  • 老资料的纸质扫描件,想搜索 / 做笔记
  • 手机拍的合同、发票、证件,想提取文字
  • 影印版图书、研究档案的电子化
  • 任何只有图像、没有文字层的 PDF

用 42md 做 OCR,你能省掉的烦恼

  • 不用安装 OCR 软件:网页拖入即用,CLI 一行 42md scan.pdf -q
  • 不用切换工具:一份文件、一次操作,识别完直接是干净 Markdown
  • 格式不会乱:段落、表格、标题都按版式还原
  • 拍照的图也能转:不止 PDF,PNG / JPG / JPEG 都支持

常见问题

为什么需要 -q 模式?

42md 默认使用「快速结构提取」,对带文字层的 PDF 很快。但扫描件 / 图片化 PDF 没有文字层,只能调用 AI 视觉模型识别,所以需要 -q 显式开启。开启时按页计费。

速度怎么样?

通常秒级出稿,长文档可并发处理,整体远快于传统 OCR。

手写笔记能识别吗?

清晰的手写体能识别,潦草字迹效果一般。建议拍照时光线足、画面正。

消耗多少配额?

按页计费。Free 会员有 42 页 OCR 体验额度;Pro 1000 页/月;Pro+ 4200 页/月。

与其他场景对比

场景推荐链接
扫描件 / 图片化 PDFOCR本页
带文字层的 PDF直接转PDF 转 Markdown
音频转录ASR音频转录

立即体验,把扫描件转成 Markdown。