PDFや画像を一瞬で構造化データに変換!100言語以上対応のAI文字認識エンジン — PaddleOCR
PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応しており、日本語・英語・中国語が混在した文書で
このトピックのトレンドリポジトリ(12件)
PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応しており、日本語・英語・中国語が混在した文書で
claude-memは、AIコーディングツール「Claude Code」のプラグインで、コーディングセッション中にClaudeが行ったすべての操作を自動的に記録し、AIで圧縮・要約した上で、次回のセッションに関連する文脈を自動で注入してくれ
Flowiseは、AIエージェント(自律的に判断して動くAIプログラム)をプログラミングなしで構築できるオープンソースのツールです。パズルのピースを組み合わせるように、画面上でブロックをドラッグ&ドロップして接続するだけで、チャットボットや
Perplexicaは、インターネット上の情報をAIが読み取り、出典付きで正確な回答を返してくれるプライバシー重視の検索エンジンです。Googleのように検索するだけでなく、AIが内容を要約して「答え」を教えてくれるのが特徴で、情報源も一緒
LightRAGは、大量の文書をAIに読み込ませて「賢く質問に答えられる仕組み」を簡単に作れるツールです。従来のRAG(検索拡張生成:AIが質問に答える前に関連情報を検索して参照する技術)に加え、文書中の人物・組織・場所などの関係性を「知識
Onyxは、ChatGPTのようなAIチャット機能を自分のサーバーに設置できるオープンソースのAIプラットフォームです。50種類以上の外部サービス(Google Drive、Slackなど)と接続し、社内の情報をAIが検索・要約してくれるR
DeepTutorは、PDFやテキストなどの学習資料をアップロードすると、その内容を理解したAIが個別指導してくれるパーソナル学習アシスタントです。単なるチャットボットではなく、質問への回答、問題の深掘り解説、クイズ生成、レポート作成、数学
opendataloader-pdfは、PDFファイルの中身(文章・表・画像・数式など)を、AIが理解しやすい形式(Markdown・JSON・HTML)に変換するオープンソースツールです。200件の実際のPDFを使ったベンチマークで総合精
promptfooは、AIアプリ(ChatGPTのようなAIを使ったサービス)の品質チェックとセキュリティ検査を自動化するツールです。「この質問をしたらAIが正しく答えるか?」「悪意ある入力で情報が漏れないか?」といったテストを、設定ファイ
OpenVikingは、AIエージェント(自律的にタスクをこなすAIプログラム)が必要とする「記憶」「資料」「スキル」をまとめて管理できるオープンソースのコンテキストデータベースです。パソコンのフォルダ構造のようにAIの知識を整理し、必要な
cogneeは、AIエージェント(自律的に動くAIプログラム)に「記憶」を持たせるためのオープンソースの知識エンジンです。文書やデータを取り込むと、意味による検索(ベクトル検索)と関係性による検索(グラフデータベース)を組み合わせて、AIが
ReMeは、AIエージェント(自動で作業をこなすAIプログラム)に「記憶」を持たせるためのツールキットです。通常のAIは長い会話の途中で昔の話を忘れてしまったり、新しい会話を始めると前回の内容をまったく覚えていなかったりしますが、ReMeを