跳转到主内容
全部文档

CLI 命令参考

核心用法

只需记住一个模式:42md <文件或网址>

bash
42md paper.pdf                 # PDF → Markdown42md lecture.mp3               # 音频 → Markdown42md https://example.com       # 网页 → Markdown42md report.docx               # Word / Excel / PPT → Markdown

-q 更精准,加 -t 顺便翻译:

bash
42md scan.pdf -q               # AI 识别(扫描件/图片,消耗配额)42md paper.pdf -t              # 转换并翻译为中文42md paper.pdf -t en           # 转换并翻译为英文

常用选项

参数说明
-qAI 识别模式(扫描件/图片,消耗配额)
-t [语言]翻译(默认中文,可指定 en/ja/ko 等)
-o <路径>指定输出文件路径

批量处理

bash
42md *.pdf                     # 批量转换当前目录所有 PDF42md ./papers/                 # 转换整个目录

多文件自动并发处理,使用 -w 控制并发数。

扩展功能

网页截图

bash
42md ss https://example.com    # 自动滚动 + 全页截图

截图保存为本地 PNG,不消耗配额。如需转为 Markdown,可对截图使用 -q

bash
42md screenshot.png -q         # 图片 → Markdown(消耗配额)

热词分析

bash
42md hotwords paper.md         # 提取关键词42md hotwords *.md -q          # AI 高精度提取(消耗配额)42md hotwords                  # 查看热词库

认证

bash
42md auth                      # 登录(邮箱 + 验证码)42md auth info                 # 查看状态和配额42md auth logout               # 退出登录

高级选项

参数说明
-p <预设>排版预设:default / wechat / blog / book / paper
-w <数量>并发 worker 数(默认 16,上限 8)
-f原地修改源文件(lint 模式)
--jsonJSON 格式输出

适配器管理

自定义网页抓取规则:

bash
42md adapter list              # 列出所有适配器42md adapter test <url>        # 测试抓取效果42md adapter create <url>      # 从样本生成 YAML 适配器42md adapter remove <name>     # 删除社区适配器