立即试一试
下面这个 demo 是把 Attention Is All You Need 论文前 3 页渲染成图像后重新合成的扫描件 PDF, 没有任何文字层。点击「立即转换」可以看到 42md 用 AI 视觉模型把它还原成完整 Markdown。

什么时候你会需要这个
- 老资料的纸质扫描件,想搜索 / 做笔记
- 手机拍的合同、发票、证件,想提取文字
- 影印版图书、研究档案的电子化
- 任何只有图像、没有文字层的 PDF
用 42md 做 OCR,你能省掉的烦恼
- 不用安装 OCR 软件:网页拖入即用,CLI 一行
42md scan.pdf -q - 不用切换工具:一份文件、一次操作,识别完直接是干净 Markdown
- 格式不会乱:段落、表格、标题都按版式还原
- 拍照的图也能转:不止 PDF,PNG / JPG / JPEG 都支持
常见问题
为什么需要 -q 模式?
42md 默认使用「快速结构提取」,对带文字层的 PDF 很快。但扫描件 / 图片化 PDF 没有文字层,只能调用 AI 视觉模型识别,所以需要 -q 显式开启。开启时按页计费。
速度怎么样?
通常秒级出稿,长文档可并发处理,整体远快于传统 OCR。
手写笔记能识别吗?
清晰的手写体能识别,潦草字迹效果一般。建议拍照时光线足、画面正。
消耗多少配额?
按页计费。Free 会员有 42 页 OCR 体验额度;Pro 1000 页/月;Pro+ 4200 页/月。
与其他场景对比
| 场景 | 推荐 | 链接 |
|---|---|---|
| 扫描件 / 图片化 PDF | OCR | 本页 |
| 带文字层的 PDF | 直接转 | PDF 转 Markdown |
| 音频转录 | ASR | 音频转录 |
立即体验,把扫描件转成 Markdown。