uv 包管理器安装 MinerU

  1. 先用 uv 安装 setuptools wheel torch
    1
    uv pip install setuptools wheel torch
  2. 然后再安装 detectron2
    1
    uv pip install --no-build-isolation git+https://github.com/facebookresearch/detectron2.git
  3. 最后安装 magic-pdf[full]
    1
    uv pip install 'magic-pdf[full]' --extra-index-url https://wheels.myhloli.com --prerelease=allow
  4. 最后检查 magic-pdf 的版本 >=0.7.0,而不是 0.6.1
  5. 如果像使用 GPU 进行 PaddlePaddle OCR 的推理,继续安装 paddlepaddle-gpu
    1
    uv pip install paddlepaddle-gpu

MinerU Command Line


MinerU API 使用指南

MinerU 的使用流程基本上是

  1. 将 PDF 加载为 magic_pdf.data.dataset.Dataset
  2. 执行 OCR 和 Layout Inference

这里还想更详细地记录一下 API,感觉 Documentation 里写的不是很全,得从 demo.py 里找。