使用 MinerU

快速配置模型源

MinerU默认使用huggingface作为模型源，若用户网络无法访问huggingface，可以通过环境变量便捷地切换模型源为modelscope：

export MINERU_MODEL_SOURCE=modelscope

有关模型源配置和自定义本地模型路径的更多信息，请参考文档中的模型源说明。

通过命令行快速使用

MinerU内置了命令行工具，用户可以通过命令行快速使用MinerU进行PDF解析：

mineru -p <input_path> -o <output_path>

Tip

<input_path>：本地 PDF/图片文件或目录

<output_path>：输出目录

未传 --api-url 时，CLI 会自动拉起本地临时 mineru-api

传入 --api-url 时，CLI 会直连远端或已有本地 FastAPI 服务

更多关于输出文件的信息，请参考输出文件说明。

Note

命令行工具会在Linux和macOS系统自动尝试cuda/mps加速。Windows用户如需使用cuda加速，请前往 Pytorch官网选择适合自己cuda版本的命令安装支持加速的torch和torchvision。

如果需要通过自定义参数调整解析选项，您也可以在文档中查看更详细的命令行工具使用说明。

通过api、webui、http-client/server进阶使用

通过python api直接调用：Python 调用示例
通过fast api方式调用：
```
mineru-api --host 0.0.0.0 --port 8000
```
Tip

在浏览器中访问 http://127.0.0.1:8000/docs 查看API文档。
- 健康检查接口：GET /health 返回 protocol_version、processing_window_size、max_concurrent_requests 等服务信息
- 异步任务提交接口：POST /tasks
- 同步解析接口：POST /file_parse
- 任务查询接口：GET /tasks/{task_id}、GET /tasks/{task_id}/result
- API 输出目录由服务端固定控制，默认写入 ./output
POST /tasks 会立即返回 task_id；POST /file_parse 会在内部提交到同一个任务管理器，等待任务完成后同步返回最终结果。任务为单进程、进程内状态实现，服务重启、--reload 热重载或多进程部署后不保证仍可查询历史任务状态。默认任务完成或失败后保留 24 小时，随后自动清理任务状态和输出目录；清理后访问任务状态或结果会返回 404。可通过环境变量 MINERU_API_TASK_RETENTION_SECONDS 和 MINERU_API_TASK_CLEANUP_INTERVAL_SECONDS 调整保留时长与清理轮询间隔。

异步任务提交示例：
```
curl -X POST http://127.0.0.1:8000/tasks \
 -F "files=@demo/pdfs/demo1.pdf" \
 -F "return_md=true"
```
同步解析示例：
```
curl -X POST http://127.0.0.1:8000/file_parse \
 -F "files=@demo/pdfs/demo1.pdf" \
 -F "return_md=true" \
 -F "response_format_zip=true" \
 -F "return_original_file=true"
```
轮询任务状态与结果：
```
curl http://127.0.0.1:8000/tasks/<task_id>
curl http://127.0.0.1:8000/tasks/<task_id>/result
curl http://127.0.0.1:8000/health
```
启动gradio webui 可视化前端：
```
mineru-gradio --server-name 0.0.0.0 --server-port 7860
```
Tip
- 在浏览器中访问 http://127.0.0.1:7860 使用 Gradio WebUI。

使用http-client/server方式调用：

# 启动openai兼容服务器(需要安装vllm或lmdeploy环境)
mineru-openai-server --port 30000

Tip

在另一个终端中通过http client连接openai server
mineru -p <input_path> -o <output_path> -b hybrid-http-client -u http://127.0.0.1:30000

Note

所有vllm/lmdeploy官方支持的参数都可用通过命令行参数传递给 MinerU，包括以下命令:mineru、mineru-openai-server、mineru-gradio、mineru-api，我们整理了一些vllm/lmdeploy使用中的常用参数和使用方法，可以在文档命令行进阶参数中获取。

基于配置文件扩展 MinerU 功能

MinerU 现已实现开箱即用，但也支持通过配置文件扩展功能。您可通过编辑用户目录下的 mineru.json 文件，添加自定义配置。

Important

mineru.json 文件会在您使用内置模型下载命令 mineru-models-download 时自动生成，也可以通过将配置模板文件复制到用户目录下并重命名为 mineru.json 来创建。

以下是一些可用的配置选项：

latex-delimiter-config：
- 用于配置 LaTeX 公式的分隔符
- 默认为$符号，可根据需要修改为其他符号或字符串。
llm-aided-config：
- 用于配置 LLM 辅助标题分级的相关参数，兼容所有支持openai协议的 LLM 模型
- 默认使用阿里云百炼的qwen3-next-80b-a3b-instruct模型
- 您需要自行配置 API 密钥并将enable设置为true来启用此功能
- 如果您的api供应商不支持enable_thinking参数，请手动将该参数删除
  - 例如，在您的配置文件中，llm-aided-config 部分可能如下所示：
```
"llm-aided-config": {
   "api_key": "your_api_key",
   "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
   "model": "qwen3-next-80b-a3b-instruct",
   "enable_thinking": false,
   "enable": false
}
```
  - 要移除enable_thinking参数，只需删除包含"enable_thinking": false的那一行，结果如下:
```
"llm-aided-config": {
   "api_key": "your_api_key",
   "base_url": "https://dashscope.aliyuncs.com/compatible-mode/v1",
   "model": "qwen3-next-80b-a3b-instruct",
   "enable": false
}
```
models-dir：
- 用于指定本地模型存储目录，请为pipeline和vlm后端分别指定模型目录，
- 指定目录后您可通过配置环境变量export MINERU_MODEL_SOURCE=local来使用本地模型。

6.2 KiB Raw Permalink Blame History Unescape Escape

使用 MinerU

快速配置模型源

通过命令行快速使用

通过api、webui、http-client/server进阶使用

基于配置文件扩展 MinerU 功能

6.2 KiB

Raw Permalink Blame History