スマホやIoTでAIをサクサク動かす！TensorFlow Liteの正統後継フレームワーク — LiteRT

google-ai-edge/LiteRTC++1.9k

LiteRTは、Googleが開発した「デバイス上で直接AIを動かす」ためのフレームワークで、TensorFlow Liteの後継にあたります。スマートフォン、パソコン、IoT機器など幅広いデバイス上で、AIモデルを高速かつ効率的に実行できるのが特長です。GPU（画像処理チップ）やNPU（AI専用チップ）といったハードウェアの力を自動的に活用して、画像認識や音声処理、さらには大規模言語モデル（ChatGPTのようなAI）までデバイス上で動かせます。クラウド（インターネット上のサーバー）に頼らずAIが動くため、通信不要・プライバシー保護・高速応答というメリットがあります。モバイルアプリ開発者やIoT機器メーカーなど、デバイス上でAI機能を組み込みたい人に最適なツールです。

🔥 なぜ話題？

生成AI（大規模言語モデルや画像生成AI）をスマートフォンなどのデバイス上で直接動かしたいというニーズが急増している中、GoogleがTensorFlow Liteを刷新しNPU対応や生成AI最適化を強化した新フレームワークとして発表したことで、大きな注目を集めています。特にQualcommやMediaTekのNPUへの統一的なアクセスが可能になった点が開発者の関心を引いています。

💡 こう使える！

例えば、Androidアプリで「カメラに映った物体をリアルタイムで認識して切り抜く（画像セグメンテーション）」機能を作りたいとき、LiteRTを使えばスマホのGPUやAI専用チップを活用して、インターネット接続なしでも滑らかに動作するアプリを開発できます。

ユースケース: スマートフォンやIoT機器のアプリにAI機能（画像認識、音声処理、チャットAIなど）をインターネット不要で組み込みたいときに使う

TensorFlow Liteの正統後継で、GPU・NPU（AI専用チップ）を自動活用して高速AI推論を実現
Android・iOS・Linux・macOS・Windows・Web・IoTとほぼ全プラットフォームに対応
大規模言語モデル（LLM）など生成AIのデバイス上での実行に特化した最適化機能を搭載

GitHubで見る →

LiteRT, successor to TensorFlow Lite. is Google's On-device framework for high-performance ML & GenAI deployment on edge platforms, via efficient conversion, runtime, and optimization

技術情報

言語

C++

ライセンス

Apache-2.0

最終更新

2026-03-14

スター数

1,911

フォーク数

235

Issue数

1,565

技術詳細

アーキテクチャ・仕組み

LiteRTはTensorFlow Liteの後継として、AIモデルの「変換（Conversion）」「ランタイム（Runtime）」「最適化（Optimization）」の3つの柱で構成されています。PyTorchモデルからの変換もサポートし、.tflite形式を経由してデバイス上で推論を実行します。

新しいCompiled Model API

アクセラレータ（GPU/NPU）の自動選択
非同期実行による全体実行時間の短縮
効率的なI/Oバッファハンドリング
NPUランタイムとモデル配布の簡素化

対応プラットフォーム・ハードウェア

プラットフォーム	CPU	GPU	NPU
Android	✅	OpenCL / OpenGL	Google Tensor, Qualcomm, MediaTek, S.LSI, Intel*
iOS	✅	Metal	ANE*
Linux	✅	WebGPU	N/A
macOS	✅	WebGPU / Metal	ANE*
Windows	✅	WebGPU	Intel*
Web	✅	WebGPU	Coming soon
IoT	✅	WebGPU	Broadcom, Raspberry Pi

（*は近日対応予定）

モデル変換パス

従来のMLモデル（PyTorch）: litert-torchコンバーターで.tflite形式に変換し、AI Edge Quantizerで量子化最適化
大規模言語モデル（LLM）: LiteRT Generative Torch APIでリオーサリング・変換後、LiteRT LMでデプロイ

GPU高速化

ゼロコピーバッファ相互運用性による遅延最小化
各種GPUバッファタイプに対応
OpenCL、OpenGL、Metal、WebGPUをサポート

ビルドシステム

CMakeおよびBazelの両方に対応
Dockerベースのビルド環境を提供（Linux/Androidクロスコンパイル対応）

ロードマップ

NPUサポートの拡大と全主要ハードウェアアクセラレータのパフォーマンス向上
生成AI（次世代オンデバイスモデル）向けの新しい最適化・機能追加
デバッグ・プロファイリング・最適化ツールの改善
コアプラットフォームのサポート強化と新プラットフォームの探索

ライセンス

Apache-2.0ライセンスで公開されており、商用利用も可能です。

インストール・クイックスタート

ソースからのビルド方法

Dockerデーモンを起動する
以下のスクリプトを実行する

cd docker_build/
./build_with_docker.sh

Linux用Dockerイメージが自動作成され、LinuxおよびAndroid（クロスコンパイル）向けのビルドが可能です。

詳細は Get Started ガイドを参照してください。CMakeやBazelを使ったビルド手順も用意されています。

過去のトレンド履歴

スマホやIoTでAIをサクサク動かす！TensorFlow Liteの正統後継フレームワーク — LiteRT

2026-03-13

13+13

スマホやIoTでAIをサクサク動かす！TensorFlow Liteの正統後継フレームワーク — LiteRT

技術情報

技術詳細

アーキテクチャ・仕組み

新しいCompiled Model API

対応プラットフォーム・ハードウェア

モデル変換パス

GPU高速化

関連エコシステム

ビルドシステム

ロードマップ

ライセンス

インストール・クイックスタート

ソースからのビルド方法

参考になる外部の関連記事

過去のトレンド履歴

関連リポジトリ