Macで画像・音声・動画を理解するAIを動かそう!Apple Silicon専用のマルチモーダルAI推論エンジン — mlx-vlm
Blaizzy/mlx-vlmAIPython
4.1k2回登場
mlx-vlmは、Mac上で画像・音声・動画を理解できるAI(Vision Language Model)を動かしたり、カスタマイズ(ファインチューニング)したりできるツールです。Apple独自のMLXフレームワーク(Apple Silic
apple-siliconflorence2ideficsllavallmlocal-aimlxmolmopaligemmapixtralvision-frameworkvision-language-modelvision-transformer