opendatalab

opendatalab / MinerU

#13
69,5405,883+644 todayPython

高质量PDF转Markdown和JSON工具。一站式开源数据提取解决方案,实现PDF到Markdown与JSON格式的精准转换。

📊 项目信息

语言
Python
Stars
69,540
Forks
5,883
今日新增
+644
排名
#13
收录
总榜
趋势日期
2026年6月25日
最后推送
2026/6/25

🏷️ 标签

ai4sciencedocument-analysisdocxextract-datalayout-analysisocrparserpdfpdf-converterpdf-extractor-llmpdf-extractor-pretrainpdf-extractor-ragpdf-parserpptxpythonxlsx

📸 截图

MinerU screenshot 1