Webブラウザ内で大規模言語モデル (LLM) を直接実行するための高性能な推論エンジンです。サーバーを介さずユーザーのデバイス(PCやスマートフォン)上でAI処理を完結させるため、プライバシー保護や低遅延といったメリットがあります。