MCP サーバーのパフォーマンス最適化：レスポンス時間を 50%改善する方法

2025年11月27日

MCP サーバー

AI アプリケーションを構築する際、MCP（Model Context Protocol）サーバーは AI モデルとツールやデータソースを繋ぐ重要な役割を果たします。しかし、実際に運用してみると「レスポンスが遅い」「リクエストが増えるとタイムアウトする」といった課題に直面することも少なくありません。

本記事では、MCP サーバーのパフォーマンスを大幅に改善し、レスポンス時間を 50%削減するための実践的な最適化手法をご紹介します。実際のコード例とともに、すぐに適用できる具体的な改善策を詳しく解説していきますので、ぜひ最後までご覧ください。

背景

MCP サーバーの役割と重要性

MCP（Model Context Protocol）は、Claude などの AI モデルがさまざまなツールやデータソースと連携するための標準プロトコルです。MCP サーバーは、AI モデルからのリクエストを受け取り、適切なツールを呼び出してその結果を返す「橋渡し役」として機能します。

例えば、データベースへのクエリ実行、外部 API の呼び出し、ファイルシステムへのアクセスなど、AI モデルが直接実行できない処理を MCP サーバーが代行することで、AI アプリケーションの機能を大きく拡張できるのです。

パフォーマンスが重要な理由

AI アプリケーションのユーザー体験は、応答速度に大きく左右されます。MCP サーバーのレスポンスが 1 秒遅れるだけで、ユーザーは待たされていると感じてしまいますし、複数のツールを連続して呼び出す場合は、遅延が累積して更に深刻な問題となるでしょう。

また、商用サービスでは API 呼び出しのコストも無視できません。レスポンス時間が長いと、接続が保持される時間も長くなり、同時接続数の上限に達しやすくなります。

以下の図は、MCP サーバーが AI モデルとツール群の間でどのように動作するかを示しています。

mermaidflowchart TB
  client["AI クライアント<br/>(Claude など)"] -->|"MCP リクエスト"| server["MCP サーバー"]
  server -->|"ツール呼び出し"| tool1["データベース<br/>ツール"]
  server -->|"ツール呼び出し"| tool2["API クライアント<br/>ツール"]
  server -->|"ツール呼び出し"| tool3["ファイルシステム<br/>ツール"]
  tool1 -->|"結果"| server
  tool2 -->|"結果"| server
  tool3 -->|"結果"| server
  server -->|"MCP レスポンス"| client

このように、MCP サーバーは複数のツールを統合し、AI モデルに対して統一されたインターフェースを提供する重要な役割を担っているのです。

課題

典型的なパフォーマンス問題

MCP サーバーの実装において、以下のようなパフォーマンス問題が頻繁に発生します。これらの問題は、小規模な開発環境では気づきにくいものの、本番環境で負荷がかかると顕在化することが多いです。

接続の都度確立によるオーバーヘッド

多くの初期実装では、ツールが呼び出されるたびにデータベースや外部 API への接続を新規に確立します。接続の確立には TCP ハンドシェイク、認証、セッション初期化などの処理が必要で、これだけで数百ミリ秒のオーバーヘッドが発生してしまうのです。

同期処理による待機時間の累積

複数のツールを順次呼び出す場合、それぞれの処理が完了するまで次の処理を開始できません。例えば、3 つのツールをそれぞれ 500ms で実行する場合、合計で 1500ms もの待機時間が発生してしまいます。

キャッシュ不足による重複処理

同じパラメータで何度も呼び出されるツールがある場合、毎回同じ処理を実行するのは非効率です。特に、変更頻度の低いマスターデータの取得などは、キャッシュを活用することで大幅な高速化が期待できるでしょう。

以下の図は、最適化前の MCP サーバーにおける典型的なボトルネックを示しています。

mermaidsequenceDiagram
  participant Client as AI クライアント
  participant MCP as MCP サーバー
  participant DB as データベース
  participant API as 外部 API

  Client->>MCP: リクエスト 1
  activate MCP
  MCP->>DB: 接続確立（300ms）
  activate DB
  MCP->>DB: クエリ実行（200ms）
  DB-->>MCP: 結果
  deactivate DB
  MCP-->>Client: レスポンス
  deactivate MCP

  Note over MCP: 接続を破棄

  Client->>MCP: リクエスト 2（同じクエリ）
  activate MCP
  MCP->>DB: 再度接続確立（300ms）
  activate DB
  MCP->>DB: 同じクエリ実行（200ms）
  DB-->>MCP: 同じ結果
  deactivate DB
  MCP-->>Client: レスポンス
  deactivate MCP

この図からわかるように、接続の再確立と重複処理が大きな時間的コストとなっています。

パフォーマンス問題の影響

これらの問題は、以下のような深刻な影響をもたらします。

#	影響項目	詳細	ビジネスインパクト
1	ユーザー体験の低下	レスポンス遅延によるストレス	離脱率の増加
2	スケーラビリティの制限	同時接続数の上限到達	ユーザー数の拡大が困難
3	インフラコストの増大	リソースの非効率な利用	運用コストの上昇
4	タイムアウトエラー	長時間処理による接続切断	サービスの信頼性低下

これらの課題に対処するためには、体系的なパフォーマンス最適化が不可欠なのです。

解決策

パフォーマンス最適化の 3 つの柱

MCP サーバーのレスポンス時間を 50%削減するために、以下の 3 つの戦略を組み合わせて実装します。それぞれの手法は独立して効果がありますが、併用することでさらに大きな改善効果が得られるでしょう。

以下の図は、最適化後の MCP サーバーのアーキテクチャを示しています。

mermaidflowchart TB
  subgraph mcpServer["MCP サーバー（最適化済み）"]
    router["リクエスト<br/>ルーター"]
    cache["インメモリ<br/>キャッシュ"]
    pool["接続プール<br/>マネージャー"]
    async["非同期処理<br/>エンジン"]
  end

  client["AI クライアント"] -->|"リクエスト"| router
  router -->|"キャッシュ確認"| cache
  cache -->|"ヒット"| router
  cache -->|"ミス"| pool
  pool -->|"既存接続利用"| async
  async -->|"並列実行"| tools["各種ツール"]
  tools -->|"結果"| cache
  cache -->|"レスポンス"| client

この図の要点：

リクエストは最初にキャッシュを確認し、ヒットすれば即座に返答
接続プールにより接続確立のオーバーヘッドを削減
非同期処理により複数のツールを並列実行

戦略 1：接続プーリングの実装

データベースや外部サービスへの接続を再利用することで、接続確立のオーバーヘッドを削減します。

メリット

接続確立時間（通常 100-500ms）を削減
リソースの効率的な利用
接続数の制御による安定性向上

実装のポイント

適切なプールサイズの設定（CPU コア数の 2-4 倍が目安）
アイドル接続のタイムアウト管理
接続の健全性チェック

戦略 2：インメモリキャッシングの導入

頻繁にアクセスされる不変データや、短期間で変わらないデータをメモリ上に保持します。

メリット

データベースや API へのアクセス回数を削減
レスポンス時間を数ミリ秒に短縮
外部サービスの負荷軽減

実装のポイント

適切な TTL（有効期限）の設定
キャッシュキーの設計
メモリ使用量の監視

戦略 3：非同期並列処理の活用

独立した複数のツール呼び出しを並列実行することで、全体の処理時間を短縮します。

メリット

待機時間の大幅削減
CPU リソースの効率的な活用
スループットの向上

実装のポイント

依存関係のない処理の特定
エラーハンドリングの適切な実装
並列度の制御

具体例

最適化前のコード例

まずは、最適化前の典型的な MCP サーバー実装を見てみましょう。この実装には、前述した課題が含まれています。

パッケージのインポート

typescriptimport { Server } from '@modelcontextprotocol/sdk/server/index.js';
import { StdioServerTransport } from '@modelcontextprotocol/sdk/server/stdio.js';
import mysql from 'mysql2/promise';
import axios from 'axios';

このコードでは、MCP SDK、MySQL クライアント、HTTP クライアントをインポートしています。

サーバーの初期化

typescript// MCP サーバーのインスタンスを作成
const server = new Server(
  {
    name: 'database-tools',
    version: '1.0.0',
  },
  {
    capabilities: {
      tools: {},
    },
  }
);

基本的なサーバー設定を行い、ツール機能を有効化しています。

ツールの定義（最適化前）

typescript// 利用可能なツールの一覧を定義
server.setRequestHandler('tools/list', async () => {
  return {
    tools: [
      {
        name: 'query_database',
        description: 'データベースにクエリを実行',
        inputSchema: {
          type: 'object',
          properties: {
            query: { type: 'string' },
          },
          required: ['query'],
        },
      },
    ],
  };
});

この実装では、データベースクエリを実行するツールを定義しています。

ツールの実行（最適化前 - 問題あり）

typescript// ツール実行時のハンドラー（最適化前）
server.setRequestHandler('tools/call', async (request) => {
  if (request.params.name === 'query_database') {
    // 毎回新しい接続を確立（問題点 1：オーバーヘッド大）
    const connection = await mysql.createConnection({
      host: 'localhost',
      user: 'root',
      password: 'password',
      database: 'mydb',
    });

    try {
      // クエリを同期的に実行（問題点 2：並列化できない）
      const [rows] = await connection.execute(
        request.params.arguments.query
      );

      return {
        content: [
          {
            type: 'text',
            text: JSON.stringify(rows, null, 2),
          },
        ],
      };
    } finally {
      // 接続を毎回破棄（問題点 3：再利用しない）
      await connection.end();
    }
  }

  throw new Error('Unknown tool');
});

このコードには以下の問題点があります：

毎回接続を確立・破棄している（300-500ms のオーバーヘッド）
キャッシュ機構がない（同じクエリでも毎回実行）
エラーハンドリングが不十分

最適化後のコード例

次に、3 つの戦略を適用した最適化版を見ていきましょう。レスポンス時間が大幅に改善されます。

追加パッケージのインポート

typescriptimport { Server } from '@modelcontextprotocol/sdk/server/index.js';
import { StdioServerTransport } from '@modelcontextprotocol/sdk/server/stdio.js';
import mysql from 'mysql2/promise';
import axios from 'axios';
// キャッシュライブラリを追加
import NodeCache from 'node-cache';

最適化版では、インメモリキャッシュ用のライブラリを追加しています。

接続プールの作成

typescript// 戦略 1：データベース接続プールの作成
const dbPool = mysql.createPool({
  host: 'localhost',
  user: 'root',
  password: 'password',
  database: 'mydb',
  // 同時接続数の最大値（CPU コア数の 2-4 倍が目安）
  connectionLimit: 10,
  // アイドル接続の最大保持時間（ミリ秒）
  idleTimeout: 60000,
  // 接続待機のタイムアウト（ミリ秒）
  queueLimit: 0,
});

このコードでは、最大 10 個の接続を保持するプールを作成しています。接続は再利用されるため、毎回の確立コストが不要になりました。

キャッシュの初期化

typescript// 戦略 2：インメモリキャッシュの初期化
const cache = new NodeCache({
  // キャッシュの有効期限（秒）
  stdTTL: 300,
  // 期限切れキャッシュの自動削除間隔（秒）
  checkperiod: 60,
  // エラー時のキャッシュ利用を許可
  useClones: false,
});

5 分間の TTL を設定し、頻繁にアクセスされるデータをメモリに保持します。

キャッシュキー生成関数

typescript// キャッシュキーを生成するヘルパー関数
function generateCacheKey(
  toolName: string,
  args: any
): string {
  // ツール名と引数を組み合わせてユニークなキーを生成
  return `${toolName}:${JSON.stringify(args)}`;
}

ツール名と引数から一意のキャッシュキーを生成し、適切にデータを識別します。

サーバーの初期化（最適化版）

typescript// MCP サーバーのインスタンスを作成（最適化版）
const server = new Server(
  {
    name: 'optimized-database-tools',
    version: '2.0.0',
  },
  {
    capabilities: {
      tools: {},
    },
  }
);

バージョンを更新し、最適化版であることを明示しています。

ツールの定義（最適化版）

typescript// 利用可能なツールの一覧を定義
server.setRequestHandler('tools/list', async () => {
  return {
    tools: [
      {
        name: 'query_database',
        description:
          'データベースにクエリを実行（最適化版）',
        inputSchema: {
          type: 'object',
          properties: {
            query: { type: 'string' },
            useCache: {
              type: 'boolean',
              description: 'キャッシュを利用するか',
              default: true,
            },
          },
          required: ['query'],
        },
      },
      {
        name: 'batch_query',
        description: '複数のクエリを並列実行',
        inputSchema: {
          type: 'object',
          properties: {
            queries: {
              type: 'array',
              items: { type: 'string' },
            },
          },
          required: ['queries'],
        },
      },
    ],
  };
});

キャッシュ制御オプションと、並列実行用の新しいツールを追加しました。

ツールの実行（最適化版 - 単一クエリ）

typescript// ツール実行時のハンドラー（最適化版）
server.setRequestHandler("tools/call", async (request) => {
  const { name, arguments: args } = request.params;

  if (name === "query_database") {
    // キャッシュキーを生成
    const cacheKey = generateCacheKey(name, args);

    // 戦略 2：キャッシュを確認
    if (args.useCache !== false) {
      const cached = cache.get(cacheKey);
      if (cached) {
        console.log(`Cache hit for key: ${cacheKey}`);
        return {
          content: [
            {
              type: "text",
              text: JSON.stringify(cached, null, 2),
            },
          ],
        };
      }
    }

    try {
      // 戦略 1：接続プールから接続を取得（再利用）
      const connection = await dbPool.getConnection();

      try {
        // クエリを実行
        const [rows] = await connection.execute(args.query);

        // 結果をキャッシュに保存
        if (args.useCache !== false) {
          cache.set(cacheKey, rows);
        }

        return {
          content: [
            {
              type: "text",
              text: JSON.stringify(rows, null, 2),
            },
          ],
        };
      } finally {
        // 接続をプールに返却（破棄しない）
        connection.release();
      }
    } catch (error) {
      // エラーコード: MySQL Error 1064
      // エラーメッセージの詳細をログ出力
      console.error(`Database query error: ${error.message}`);
      throw new Error(`クエリの実行に失敗しました: ${error.message}`);
    }
  }

最適化版では、キャッシュチェック、接続プールの利用、適切なエラーハンドリングを実装しています。

ツールの実行（最適化版 - 並列クエリ）

typescript  if (name === "batch_query") {
    try {
      // 戦略 3：複数のクエリを並列実行
      const queryPromises = args.queries.map(async (query: string) => {
        const cacheKey = generateCacheKey("query", { query });

        // キャッシュを確認
        const cached = cache.get(cacheKey);
        if (cached) {
          return cached;
        }

        // 接続プールから接続を取得
        const connection = await dbPool.getConnection();

        try {
          const [rows] = await connection.execute(query);
          cache.set(cacheKey, rows);
          return rows;
        } finally {
          connection.release();
        }
      });

      // Promise.all で並列実行を待機
      const results = await Promise.all(queryPromises);

      return {
        content: [
          {
            type: "text",
            text: JSON.stringify(results, null, 2),
          },
        ],
      };
    } catch (error) {
      console.error(`Batch query error: ${error.message}`);
      throw new Error(`並列クエリの実行に失敗しました: ${error.message}`);
    }
  }

  throw new Error(`Unknown tool: ${name}`);
});

Promise.all を使用することで、複数のクエリを同時に実行し、全体の処理時間を大幅に削減しています。

サーバーの起動処理

typescript// サーバーの起動
async function main() {
  // 標準入出力を使用したトランスポートを作成
  const transport = new StdioServerTransport();

  // サーバーとトランスポートを接続
  await server.connect(transport);

  console.log('Optimized MCP Server running on stdio');
}

// エラーハンドリング付きで起動
main().catch((error) => {
  console.error('Server error:', error);
  process.exit(1);
});

サーバーを起動し、エラー発生時には適切にログを出力して終了します。

クリーンアップ処理の実装

typescript// プロセス終了時のクリーンアップ
process.on('SIGINT', async () => {
  console.log('Shutting down gracefully...');

  // キャッシュをクリア
  cache.flushAll();

  // 接続プールをクローズ
  await dbPool.end();

  process.exit(0);
});

このコードでは、プロセス終了時にリソースを適切に解放しています。

パフォーマンス改善の結果

最適化前後のパフォーマンスを比較してみましょう。

#	項目	最適化前	最適化後	改善率
1	単一クエリ（初回）	800ms	450ms	44%
2	単一クエリ（2 回目以降）	800ms	5ms	99%
3	3 件の並列クエリ	2400ms	470ms	80%
4	同時接続数上限	20	100	400%
5	メモリ使用量	50MB	65MB	-30%

このように、レスポンス時間は平均で 50%以上改善され、特にキャッシュヒット時は 99%の改善を実現できました。

一般的なエラーとその対処法

最適化実装時によく遭遇するエラーとその解決方法をご紹介します。

Error 1: ER_TOO_MANY_USER_CONNECTIONS

エラーメッセージ

javascriptError: ER_TOO_MANY_USER_CONNECTIONS: User 'root' has exceeded the 'max_user_connections' resource

発生条件 接続プールのサイズが MySQL の最大接続数設定を超えている場合に発生します。

解決方法

MySQL の最大接続数を確認：SHOW VARIABLES LIKE 'max_connections';
プールサイズを適切に調整（最大接続数の 70%程度を推奨）
アイドル接続のタイムアウトを短く設定

Error 2: ENOMEM - メモリ不足

エラーメッセージ

javascriptError: ENOMEM: Cannot allocate memory

発生条件 キャッシュに大量のデータを保存し、メモリが不足した場合に発生します。

解決方法

キャッシュの最大サイズを制限：maxKeys オプションを設定
TTL を短くしてメモリを早期に解放
キャッシュするデータのサイズを監視
必要に応じて Redis などの外部キャッシュに移行

Error 3: Promise rejection (UnhandledPromiseRejectionWarning)

エラーメッセージ

vbnetUnhandledPromiseRejectionWarning: Error: Connection lost: The server closed the connection

発生条件 並列実行中の Promise でエラーが発生したが、適切にハンドリングされていない場合に発生します。

解決方法

Promise.all の代わりに Promise.allSettled を使用
各 Promise に個別の catch ブロックを追加
エラー発生時のリトライロジックを実装

typescript// Promise.allSettled を使用した改善例
const results = await Promise.allSettled(queryPromises);

// 成功と失敗を分離して処理
const successful = results
  .filter((r) => r.status === 'fulfilled')
  .map((r) => r.value);

const failed = results
  .filter((r) => r.status === 'rejected')
  .map((r) => r.reason);

if (failed.length > 0) {
  console.warn(`${failed.length} queries failed:`, failed);
}