複雑な表・手書き・数式もまるごとデジタル化!90言語対応の最先端OCRモデル — chandra
Chandra OCR 2は、画像やPDFに含まれる文字を読み取り、表や数式、手書き文字などのレイアウト情報を保ったままMarkdown・HTML・JSON形式に変換できるAI OCR(光学文字認識)モデルです。90以上の言語に対応しており、日本語・中国語・アラビア語などの多言語文書もそのまま処理できます。チェックボックス付きのフォームや複雑なレイアウトの再現、画像やグラフの抽出とキャプション付与まで行えるのが特長です。広く使われているベンチマーク(性能比較テスト)でトップクラスのスコアを記録しており、GPT-4oやGeminiなどの大手AIモデルを上回る精度を実現しています。プログラマーだけでなく、書類のデジタル化を効率化したいすべての人に役立つツールです。
🔥 なぜ話題?
企業のペーパーレス化やRAG(検索拡張生成)パイプラインの普及に伴い、高精度なOCRへの需要が急増しています。Chandra OCR 2は、既存の大手AIモデル(GPT-4o、Gemini等)を上回るベンチマークスコアと90言語対応という強みで、多言語文書処理の決定版として注目を集めています。
💡 こう使える!
例えば、海外の取引先から届いた手書きの契約書や複雑な表が含まれたPDF請求書をChandraに読み込ませると、表の構造やチェックボックスの状態を正確に再現したMarkdownファイルが自動生成され、そのままドキュメント管理システムに取り込んだり検索可能な形で保存したりできます。
ユースケース: 紙の書類やPDFに含まれる表・手書き・数式などを、レイアウトを保ったまま編集可能なデジタルデータに自動変換したいときに使います。
- 90以上の言語に対応し、多言語ベンチマークで平均77.8%(Gemini 2.5 Flashの67.6%を大幅に上回る)を達成
- 手書き文字・数式・複雑な表・チェックボックス付きフォームなどの難しい文書も正確に構造化
- コマンド1つでPDFからMarkdown/HTML/JSONに変換でき、vLLMサーバーによる大量バッチ処理にも対応
OCR model that handles complex tables, forms, handwriting with full layout.