PDFや画像を一瞬で構造化データに変換!100言語以上対応のAI文字認識エンジン — PaddleOCR
PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応しており、日本語・英語・中国語が混在した文書で
このトピックのトレンドリポジトリ(6件)
PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応しており、日本語・英語・中国語が混在した文書で
A community-supported supercharged document management system: scan, index and archive all your documents
ShareX is a free and open-source application that enables users to capture or record any area of their screen with a single keystroke. It also supports uploading images, text, and various file types to a wide range of destinations.
opendataloader-pdfは、PDFファイルの中身(文章・表・画像・数式など)を、AIが理解しやすい形式(Markdown・JSON・HTML)に変換するオープンソースツールです。200件の実際のPDFを使ったベンチマークで総合精
Chandra OCR 2は、画像やPDFに含まれる文字を読み取り、表や数式、手書き文字などのレイアウト情報を保ったままMarkdown・HTML・JSON形式に変換できるAI OCR(光学文字認識)モデルです。90以上の言語に対応しており
A fast, helpful, and open-source document parser