PDFや画像を一瞬で構造化データに変換！100言語以上対応のAI文字認識エンジン — PaddleOCR

PaddlePaddle/PaddleOCRPython81.2k

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 100+ languages.

技術情報

言語

Python

ライセンス

Apache-2.0

最終更新

2026-06-04

スター数

81,160

フォーク数

10,671

Issue数

206

トピック

ai4sciencechineseocrdocument-parsingdocument-translationkieocrpaddleocr-vlpdf-extractor-ragpdf-parserpdf2markdownpp-ocrpp-structurerag

過去のトレンド履歴

2026-06-06

5+747

2026-06-05

7+755

2026-06-04

12+105

PDFや画像を一瞬で構造化データに変換！100言語以上対応のAI文字認識エンジン — PaddleOCR

2026-04-01

9+439

PDFや画像を一瞬で構造化データに変換！100言語以上対応のAI文字認識エンジン — PaddleOCR

技術情報

過去のトレンド履歴

関連リポジトリ