画面も会話もすべて記憶するAI「第2の脳」— 30万人が使うオープンソース — omi

BasedHardware/omiDart10.0k

omiは、パソコンの画面や日常の会話をリアルタイムで記録・文字起こしし、要約やタスクリストを自動生成してくれる「第2の脳」とも呼べるAIツールです。デスクトップアプリ、スマホアプリ、さらには専用のウェアラブルデバイス(身に着ける小型機器)にも対応しており、見たこと・聞いたことすべてを覚えているAIチャットに何でも質問できます。30万人以上の専門家に利用されており、ソースコード(プログラムの設計図)からハードウェアの設計図まですべてがオープンソース(無料で公開)されています。macOS、iOS、Android、ブラウザなど幅広い環境で動作し、プライバシーを気にする人にも安心の選択肢です。

🔥 なぜ話題?

AIが日常のあらゆる情報を記録・整理してくれる『パーソナルAIアシスタント』への関心が高まる中、画面キャプチャと音声の両方を統合的に扱え、しかもハードウェアまで含めて完全にオープンソースという点が、プライバシー意識の高い開発者やプロフェッショナル層から強い支持を集めています。

💡 こう使える!

例えば、1日に複数のオンライン会議がある忙しいビジネスパーソンが、omiを起動しておくだけで全ての会議の内容が自動で文字起こし・要約され、『先週の企画会議で田中さんが提案したアイデアは何だった?』とAIチャットに聞けば、すぐに該当部分を教えてくれます。

ユースケース: 日々の会議や作業内容をすべて自動記録し、後から『あのとき何を話したっけ?』をAIに質問して瞬時に思い出せるようにする

  • 画面と音声の両方をリアルタイムで記録・文字起こしし、要約やタスクを自動生成
  • デスクトップ・スマホ・ブラウザ・ウェアラブル端末と幅広いデバイスに対応
  • ハードウェア設計図まで含めた完全オープンソース(MITライセンス)で30万人以上が利用
GitHubで見る →

AI that sees your screen, listens to your conversations and tells you what to do

技術情報

言語

Dart

ライセンス

MIT

最終更新

2026-04-18

スター数

10,044

フォーク数

1,686

Issue数

544

トピック

aiappbcicflutterfriendmobilenecklacenextjsomipersonaspythonsmartglassessummarytranscriptionwearable

技術詳細

アーキテクチャ

omiは複数のコンポーネントで構成されるマルチデバイス対応システムです。

コンポーネントパス技術スタック
macOSアプリdesktop/Swift, SwiftUI, Rustバックエンド
モバイルアプリapp/Flutter(iOS & Android)
バックエンドAPIbackend/Python, FastAPI, Firebase
ファームウェアomi/nRF, Zephyr, C
Omi GlassomiGlass/ESP32-S3, C
SDKsdks/React Native, Swift, Python
AIペルソナweb/personas-open-source/Next.js

バックエンド構成

  • REST API / WebSocket: Listen(REST)とPusher(WS)による通信
  • 音声処理: VAD(音声区間検出)とDiarizer(話者分離)はGPU上で動作
  • 音声認識(STT): Deepgramを利用
  • データベース: Google Firestore
  • キャッシュ: Redis
  • AI処理: LLM(大規模言語モデル)による要約・チャット

通信方式

  • ウェアラブルデバイス → アプリ: BLE(Bluetooth Low Energy)
  • デスクトップ/モバイル → バックエンド: HTTPS / WebSocket

対応プラットフォーム

  • macOS: 14以上(Swift/SwiftUI + Rustバックエンド)
  • iOS: App Store公開済み
  • Android: Google Play公開済み
  • ブラウザ: Webアプリあり(app.omi.me)

ハードウェア

  • Omi Wearable: nRFベースの小型ウェアラブルデバイス、24時間以上の連続キャプチャ対応
  • Omi Glass Dev Kit: ESP32-S3搭載、カメラ+オーディオ対応のメガネ型デバイス
  • ハードウェア設計はオープンソースで公開されており、自作も可能

SDK・連携

  • Python SDK、Swift SDK、React Native SDKを提供
  • MCP Server(Model Context Protocol)統合に対応
  • サードパーティアプリ開発が可能(GitHub連携、Slack連携などのサンプルあり)
  • オーディオストリーミングアプリやカスタムチャットツールの構築に対応

主要機能

  • リアルタイム音声文字起こし
  • 画面キャプチャと記録
  • 自動要約・アクションアイテム生成
  • 記録内容全体を対象にしたAIチャット
  • 話者分離(誰が何を話したか識別)
  • AIペルソナのカスタマイズ

ライセンス

MITライセンス — 商用利用を含む自由な利用が可能

インストール・クイックスタート

macOS クイックスタート(最速)

git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh --yolo

クラウドバックエンドに接続してmacOSアプリをビルド・起動します。環境変数や認証情報の設定は不要です。

必要な環境: macOS 14以上、Xcode、Node.js

フルインストール(ローカル開発用)

xcode-select --install
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
git clone https://github.com/BasedHardware/omi.git
cd omi/desktop
cp Backend-Rust/.env.example Backend-Rust/.env
./run.sh

モバイルアプリ

cd app && bash setup.sh ios    # または: bash setup.sh android

ブラウザ版は https://app.omi.me から試用可能です。

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ

あらゆるAIモデルを束ねて社内チャット・検索・研究を全自動化するオープンソース基盤 — onyx

onyx-dot-app/onyxPython25.3k

Onyxは、ChatGPTのようなAIチャット機能を自分のサーバーに設置できるオープンソースのAIプラットフォームです。50種類以上の外部サービス(Google Drive、Slackなど)と接続し、

AIへの「話しかけ方」が14万人に支持された世界最大のプロンプト集 — prompts.chat

f/prompts.chatHTML157.4k

prompts.chatは、ChatGPTやClaude、Geminiなど様々なAIチャットツールで使える「お手本の質問文(プロンプト)」を集めた世界最大のオープンソースライブラリです。2022年12

キーワードを入れるだけでAIが高画質ショート動画を自動生成! — MoneyPrinterTurbo

harry0703/MoneyPrinterTurboPython53.0k

MoneyPrinterTurboは、動画のテーマやキーワードを入力するだけで、AIが台本作成・映像素材の収集・字幕生成・BGM追加まですべて自動でこなし、高画質なショート動画を一発で作ってくれるツー

LINEもQQもSlackも!あらゆるチャットアプリにAIボットを一発導入できる万能プラットフォーム — AstrBot

AstrBotDevs/AstrBotPython24.2k

AstrBotは、さまざまなチャットアプリ(メッセージングアプリ)にAIチャットボットを簡単に導入できるオープンソースのプラットフォームです。QQ、Telegram、Slack、Discord、LIN

AIエージェントを組み合わせて複雑なタスクを自動化!100以上のLLM対応の軽量フレームワーク — openai-agents-python

openai/openai-agents-pythonPython22.0k

OpenAI Agents SDKは、複数のAIエージェント(自律的に考えて行動するAIプログラム)を連携させて複雑な作業を自動化できるPython向けフレームワークです。OpenAIだけでなく100