opendatalab

opendatalab / MinerU

#7
70,4035,939+960 todayPython

高质量PDF转Markdown和JSON工具。一站式开源数据提取解决方案,实现PDF到Markdown与JSON格式的精准转换。

📊 项目信息

语言
Python
Stars
70,403
Forks
5,939
今日新增
+960
排名
#7
收录
总榜
趋势日期
2026年6月26日
最后推送
2026/6/26

🏷️ 标签

ai4sciencedocument-analysisdocxextract-datalayout-analysisocrparserpdfpdf-converterpdf-extractor-llmpdf-extractor-pretrainpdf-extractor-ragpdf-parserpptxpythonxlsx

📸 截图

MinerU screenshot 1