RAGはAIの精度向上に有効です。しかし、従来はサーバーやベクトルDBが必要でした。Waxはこの常識を覆します。つまり、サーバー不要の単一ファイルメモリレイヤーです。そこで今回は、Waxの仕組みと性能を解説します。
Waxの基本的な仕組み
WaxはSwiftネイティブのAIメモリレイヤーです。Christopher Karaniが開発しました。具体的には、複雑なRAGパイプラインを単一の.waxファイルに置き換えます。また、SQLiteベースでデータを格納します。さらに、すべての処理がデバイス上で完結します。つまり、クラウド依存がゼロなのです。しかも、オフラインでも完全に機能します。そのため、プライバシーを重視するアプリに最適です。
技術アーキテクチャの詳細
ベクトル検索にはHNSWアルゴリズムを採用しています。また、全文検索にはBM25インデックスを使います。さらに、MiniLMモデルをローカルで実行して埋め込みを生成します。特にApple Silicon向けのMetal GPU加速にも対応しています。そのため、高速な検索が可能です。加えて、追記形式とライトアヘッドロギングでクラッシュ安全性も確保しています。
ユースケースと今後の展望
会話型AIエージェントでの活用が最も有望です。具体的には、ユーザー設定や会話履歴を記憶させられます。また、セマンティック検索付きのノートアプリにも使えます。さらに、機密データを扱うオンデバイスRAGにも適しています。なお、現在のバージョンは0.1.8です。
GitHubで587スターを獲得しApache 2.0で公開されています。しかし、iOS/macOS向けに限定されている点は注意が必要です。今後はCloudKit同期やiCloud Drive統合が予定されています。したがって、Appleエコシステムの開発者にとって注目のツールです。だからこそ、オンデバイスAIに関心のある方はチェックしておくべきです。