opendatalab

opendatalab / MinerU

#13
65,6155,534+150 todayPython

高质量PDF转Markdown和JSON工具。一站式开源数据提取解决方案,实现PDF到Markdown与JSON格式的精准转换。

📊 项目信息

语言
Python
Stars
65,615
Forks
5,534
今日新增
+150
排名
#13
收录
语言榜
趋势日期
2026年5月29日
最后推送
2026/5/28

🏷️ 标签

ai4sciencedocument-analysisdocxextract-datalayout-analysisocrparserpdfpdf-converterpdf-extractor-llmpdf-extractor-pretrainpdf-extractor-ragpdf-parserpptxpythonxlsx

📸 截图

MinerU screenshot 1