opendatalab

opendatalab / MinerU

#9
71,5566,012+380 todayPython

高质量PDF转Markdown和JSON工具。一站式开源数据提取解决方案,实现PDF到Markdown与JSON格式的精准转换。

📊 项目信息

语言
Python
Stars
71,556
Forks
6,012
今日新增
+380
排名
#9
收录
总榜
趋势日期
2026年6月28日
最后推送
2026/6/27

🏷️ 标签

ai4sciencedocument-analysisdocxextract-datalayout-analysisocrparserpdfpdf-converterpdf-extractor-llmpdf-extractor-pretrainpdf-extractor-ragpdf-parserpptxpythonxlsx

📸 截图

MinerU screenshot 1