opendatalab/MinerUPython69.1k
GitHubで見る →
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
言語
Python
ライセンス
NOASSERTION
最終更新
2026-06-22
スター数
69,092
フォーク数
5,839
Issue数
26
トピック
PaddlePaddle/PaddleOCR
paperless-ngx/paperless-ngx
PDFの中身をAIが読める形に変換!精度No.1のオープンソースPDFパーサー — opendataloader-pdf
opendataloader-pdfは、PDFファイルの中身(文章・表・画像・数式など)を、AIが理解しやすい形式(Markdown・JSON・HTML)に変換するオープンソースツールです。200件の
donnemartin/system-design-primer
yt-dlp/yt-dlp