スマホもPCも自動操作!人間のようにタップして作業してくれるAIアシスタント — MobileAgent

X-PLUG/MobileAgentPython7.8k

MobileAgentは、スマートフォンやパソコン、ブラウザの画面を見て、人間のように自動操作できるAIエージェントです。「メールを送って」「ネット検索して」といった指示を日本語で伝えるだけで、アプリを開いて必要な操作を全て代行してくれます。アリババのAI研究チームが開発し、20以上のテストで最高性能を記録しています。プログラミング知識がなくても、まるで優秀な秘書のようにデジタル作業を任せられるのが魅力です。

🔥 なぜ話題?

生成AIの進化により、文字や画像だけでなく「実際の操作」も自動化できるようになった今、デジタル秘書のような存在として大きな注目を集めています。特に複数デバイス対応と高い操作精度が話題です。

💡 こう使える!

「今日の天気を調べてメモアプリに保存して」と指示すると、天気アプリを開いて情報を確認し、自動的にメモアプリに切り替えて天気情報を入力・保存まで完了してくれます。

ユースケース: 日常的なスマホ・PC操作の自動化や、繰り返し作業の効率化

  • スマホ・PC・ブラウザの画面を見て自動操作
  • 20以上のベンチマークで最高性能を達成
GitHubで見る →

Mobile-Agent: The Powerful GUI Agent Family

過去のトレンド履歴

関連リポジトリ

PDF・Word・Excel・画像…なんでもMarkdownに一発変換!AI時代の万能ファイル変換ツール — markitdown

microsoft/markitdownPython109.1k

MarkItDownは、PDF、Word、Excel、PowerPoint、画像、音声、HTMLなど、さまざまな形式のファイルをMarkdown(シンプルな書式付きテキスト)に変換するPython製の

LLMアプリのレシピ集!ChatGPTから音声エージェントまで実例満載 — awesome-llm-apps

Shubhamsaboo/awesome-llm-appsPython99.0k

awesome-llm-appsは、ChatGPTやGeminiなどの大規模言語モデル(AIの文章生成技術)を使った実用的なアプリケーションの作り方を集めたレシピ集です。AIエージェント(自動でタスク

写真1枚でリアルタイム顔入れ替え!ワンクリックでディープフェイク映像を生成 — Deep-Live-Cam

hacksider/Deep-Live-CamPython90.5k

Deep-Live-Camは、たった1枚の写真を用意するだけで、ウェブカメラの映像やビデオの中の顔をリアルタイムに別人の顔に入れ替えられるソフトウェアです。「顔を選ぶ→カメラを選ぶ→ライブボタンを押す

使うほど賢くなるAIエージェント — 学習・記憶・自動化を全部入りで月5ドルから運用 — hermes-agent

NousResearch/hermes-agentPython87.5k

Hermes Agentは、Nous Research社が開発した「自己改善するAIエージェント」です。会話するたびに経験からスキルを自動生成し、ユーザーの好みや過去のやり取りを記憶して、使えば使うほ

AIに「このサイトで○○して」と頼むだけ!ブラウザ操作を全自動化するエージェント — browser-use

browser-use/browser-usePython84.1k

browser-useは、AI(人工知能)にウェブブラウザを操作させて、オンラインの作業を自動化できるPython製のツールです。「この求人に応募して」「買い物リストの商品をカートに入れて」といった自