Cinnamon/kotaemonPython25.1k

kotaemonは、文書との対話型Q&Aを可能にするオープンソースのRAG(Retrieval-Augmented Generation)ベースのチャットUIツールです。エンドユーザーが簡単に文書にチャットで質問できるクリーンなインターフェースを提供し、開発者向けにはカスタマイズ可能なRAGパイプライン構築機能を備えています。PDF、Word、テキストファイルなどの様々な文書形式に対応し、複数のLLMプロバイダー(OpenAI、Anthropic、ローカルモデルなど)をサポートしています。Dockerでの簡単な導入やHugging Face Spacesでのライブデモも提供されており、企業の社内文書検索システムや個人の文書管理ツールとして活用できます。

ユースケース: 企業の社内文書や個人の資料に対して自然言語で質問・検索を行いたい場合

  • 複数のLLMプロバイダーとファイル形式に対応
  • エンドユーザー向けのクリーンなUIと開発者向けのカスタマイズ性を両立
GitHubで見る →

An open-source RAG-based tool for chatting with your documents.

関連リポジトリ

LLMアプリのレシピ集!ChatGPTから音声エージェントまで実例満載 — awesome-llm-apps

Shubhamsaboo/awesome-llm-appsPython99.0k

awesome-llm-appsは、ChatGPTやGeminiなどの大規模言語モデル(AIの文章生成技術)を使った実用的なアプリケーションの作り方を集めたレシピ集です。AIエージェント(自動でタスク

写真1枚でリアルタイム顔入れ替え!ワンクリックでディープフェイク映像を生成 — Deep-Live-Cam

hacksider/Deep-Live-CamPython90.5k

Deep-Live-Camは、たった1枚の写真を用意するだけで、ウェブカメラの映像やビデオの中の顔をリアルタイムに別人の顔に入れ替えられるソフトウェアです。「顔を選ぶ→カメラを選ぶ→ライブボタンを押す

AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use

browser-use/browser-usePython84.1k

browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自

PDFや画像を一瞬で構造化データに変換!100言語以上対応のAI文字認識エンジン — PaddleOCR

PaddlePaddle/PaddleOCRPython74.5k

PaddleOCRは、PDFや画像の中にある文字・表・数式・グラフなどを読み取り、MarkdownやJSON(コンピュータが扱いやすいデータ形式)に自動変換するツールです。100以上の言語に対応してお

openai/whisper

openai/whisperPython60.0k

WhisperはOpenAIが開発した高精度な音声認識モデルです。多言語対応で、日本語を含む99言語の音声をテキストに変換できます。ノイズの多い環境でも安定した認識精度を発揮し、文字起こし作業の自動化