MinerU 管線分析:PDF 解析的 Layout-OCR 二階段架構深入分析 MinerU 開源 PDF 解析工具的二階段架構:Layout Detection 定位文件元素,OCR 階段辨識內容。從模型選型到實作細節的完整技術拆解。AIDocument Parsing2025年1月15日4 min read