Gemini CLI と OpenAI CLI を横並び比較：フラグ体系・入出力・コストの違い

2025年11月12日

Gemini CLI

Gemini CLI と OpenAI CLI を横並び比較：フラグ体系・入出力・コストの違い

AI モデルを CLI（コマンドラインインターフェース）から使えると、開発ワークフローが劇的に効率化されますよね。2025 年現在、Google の Gemini と OpenAI の両方が公式 CLI ツールをリリースしています。では、この 2 つの CLI はどのような違いがあるのでしょうか。

この記事では、Gemini CLI と OpenAI Codex CLI を フラグ体系、入出力の仕組み、コスト面 の 3 つの観点から徹底比較します。実際にどちらを選ぶべきか、それぞれの強みと弱みを理解して、最適な選択ができるようになりましょう。

背景

AI CLI ツールの必要性

近年の AI モデルの進化により、コード生成やデバッグ、ドキュメント作成などの開発業務を AI に任せられるようになりました。しかし、Web ブラウザを開いて AI にアクセスするのは、開発フローの中断を意味します。

ターミナルから直接 AI を呼び出せれば、コーディング中に画面を切り替えることなく、自然な流れで AI の力を借りられますね。このニーズに応えるため、Google と OpenAI はそれぞれ CLI ツールを提供しています。

2025 年時点での CLI ツール概要

2025 年 1 月時点で、以下の公式 CLI ツールが利用可能です。

#	プロバイダー	ツール名	主要モデル	リリース状況
1	Google	Gemini CLI	Gemini 2.5 Pro	正式版
2	OpenAI	Codex CLI	GPT-4o, o4	正式版

両ツールともオープンソースで公開されており、GitHub でソースコードを確認できます。ただし、機能やアーキテクチャには大きな違いがあるため、用途に応じた選択が重要になるでしょう。

以下の図は、それぞれの CLI がどのように動作するかの基本構造を示しています。

mermaidflowchart TB
    developer["開発者"] -->|コマンド実行| cli_choice{CLI 選択}
    cli_choice -->|gemini コマンド| gemini_cli["Gemini CLI"]
    cli_choice -->|codex コマンド| openai_cli["OpenAI Codex CLI"]

    gemini_cli -->|API リクエスト| gemini_api["Gemini API<br/>(2.5 Pro)"]
    openai_cli -->|API リクエスト| openai_api["OpenAI API<br/>(GPT-4o/o4)"]

    gemini_api -->|レスポンス| gemini_cli
    openai_api -->|レスポンス| openai_cli

    gemini_cli -->|結果表示| terminal["ターミナル"]
    openai_cli -->|結果表示| terminal
    terminal -->|確認| developer

この図から分かるように、どちらも開発者とクラウド API の間を仲介する役割を果たします。ただし、フラグの使い方や入出力のスタイルには違いがあり、それが開発体験に影響を与えるのです。

課題

CLI ツール選択の判断基準が不明確

Gemini CLI と OpenAI Codex CLI のどちらを選ぶべきかは、公式ドキュメントを読むだけでは判断しづらいでしょう。両者の 実際の使用感やコスト差 を理解しないと、プロジェクトに最適な選択ができません。

フラグ体系の違いによる学習コスト

CLI ツールの使い勝手は、コマンドラインフラグの設計に大きく左右されます。 Gemini CLI と OpenAI Codex CLI では、フラグの命名規則や構成が異なるため、両方を使い分ける場合は学習コストが発生します。

コスト計算が複雑

API の料金体系は、入力トークン数と出力トークン数によって変動します。 Gemini と OpenAI では、モデルごとに異なる料金設定があり、どちらが本当にコストパフォーマンスに優れているのか分かりにくいでしょう。

以下の図は、CLI ツールを選択する際に考慮すべき主要な課題を示しています。

mermaidflowchart LR
    selection["CLI 選択課題"]
    selection --> challenge1["学習コスト<br/>フラグ体系の違い"]
    selection --> challenge2["使用感<br/>入出力の仕組み"]
    selection --> challenge3["運用コスト<br/>API 料金"]

    challenge1 --> impact1["コマンド習得に時間"]
    challenge2 --> impact2["ワークフロー効率"]
    challenge3 --> impact3["予算管理"]

これらの課題を解決するには、両 CLI の具体的な違いを詳しく理解する必要がありますね。

解決策

フラグ体系の横並び比較

Gemini CLI と OpenAI Codex CLI のフラグ体系を比較することで、どちらが自分の使い方に合っているかを判断できます。

以下の表は、主要なフラグとその役割を整理したものです。

#	機能カテゴリ	Gemini CLI	OpenAI Codex CLI	備考
1	モデル選択	`--model`	`--model`	両方とも同じフラグ名
2	Web 検索有効化	組み込み（Google Search）	`--search`	Gemini は標準搭載
3	自動実行モード	設定ファイルで制御	`--full-auto`	OpenAI はフラグで制御
4	非対話モード	通常実行	`codex exec` / `codex e`	OpenAI は専用サブコマンド
5	セッション継続	チェックポイント機能	`--continue`	アプローチが異なる

入出力の違いを理解する

CLI ツールの使い勝手を左右するのが、入出力の仕組みです。対話型 UI か、それとも非対話型での実行が中心かで、開発ワークフローへの組み込み方が変わってきますね。

Gemini CLI の入出力特性

Gemini CLI は、以下のような入出力スタイルを採用しています。

bash# 基本的な対話型実行
gemini "コードのバグを修正して"

bash# ファイル操作を含む実行（MCP サーバー経由）
gemini --mcp file-operations "プロジェクトのテストを改善して"

Gemini CLI の特徴は、ReAct ループ（Reason and Act）を採用している点です。これは、モデルが理由を考えてから行動を起こすサイクルを繰り返す仕組みで、複雑なタスクに対応できます。

また、MCP（Model Context Protocol）サーバー との統合により、ローカルツールやリモートサービスと連携できるのが強みでしょう。

OpenAI Codex CLI の入出力特性

OpenAI Codex CLI は、対話型 TUI（Terminal User Interface）を標準とします。

bash# デフォルトで対話型 UI が起動
codex

bash# 非対話型での実行（CI/CD に適している）
codex exec "テストコードを生成して"

OpenAI Codex CLI の強みは、対話型 UI の洗練度 です。ターミナル上で直感的に操作でき、画像の添付やセッションの再開も簡単に行えます。

codex exec サブコマンドを使えば、スクリプトや CI/CD パイプラインに組み込むことも可能です。

以下の図は、両 CLI の入出力フローの違いを示しています。

mermaidsequenceDiagram
    participant dev as 開発者
    participant gemini as Gemini CLI
    participant openai as OpenAI Codex CLI
    participant api as API

    Note over dev,api: Gemini CLI の場合
    dev->>gemini: コマンド実行（1 回）
    gemini->>api: リクエスト（ReAct ループ）
    api-->>gemini: 理由と行動
    gemini->>api: 追加リクエスト
    api-->>gemini: 最終レスポンス
    gemini-->>dev: 結果出力

    Note over dev,api: OpenAI Codex CLI の場合
    dev->>openai: codex（対話型起動）
    openai-->>dev: TUI 表示
    dev->>openai: プロンプト入力
    openai->>api: リクエスト
    api-->>openai: レスポンス
    openai-->>dev: 結果表示（TUI）

このシーケンス図から、Gemini CLI は 自律的なループ処理 が得意で、OpenAI Codex CLI は ユーザーとの対話 に最適化されていることが分かりますね。

コスト比較の明確化

API 利用料金は、プロジェクトの予算に直接影響します。 2025 年 1 月時点での料金体系を比較してみましょう。

Gemini API の料金（2025 年 1 月）

#	モデル	入力トークン単価	出力トークン単価	特徴
1	Gemini 2.5 Pro（〜200K トークン）	$1.25 / 100 万	$10.00 / 100 万	最新モデル
2	Gemini 2.5 Pro（200K〜）	$2.50 / 100 万	$15.00 / 100 万	長文入力時
3	Gemini 2.0 Flash	$0.10 / 100 万	$0.40 / 100 万	高速・低コスト
4	Gemini Flash	$0.20 / 100 万	未公開	最安モデル

Gemini の強みは、Flash モデルのコストパフォーマンス です。入力トークンが 100 万あたり $0.10 と、非常に安価に利用できますね。

また、バッチ処理では 50% の割引 が適用されるため、大量処理には有利でしょう。

OpenAI API の料金（2025 年 1 月）

#	モデル	入力トークン単価	出力トークン単価	特徴
1	GPT-4o	$2.50 / 100 万	$10.00 / 100 万	主力モデル
2	GPT-4o Mini	$0.15 / 100 万	$0.60 / 100 万	低コスト版
3	GPT-4 Turbo	$10.00 / 100 万	$30.00 / 100 万	高性能
4	GPT-4（標準）	$30.00 / 100 万	$60.00 / 100 万	従来版

OpenAI の強みは、GPT-4o のバランスの良さ です。 Gemini 2.5 Pro と同等の性能を持ちながら、価格も近い水準に設定されています。

GPT-4o Mini は、軽量タスク向けに非常に低コストで利用できるため、用途によって使い分けられますね。

コスト比較シミュレーション

実際の利用シーンを想定して、コストを比較してみましょう。

ケース 1：短いプロンプト（1,000 入力トークン、500 出力トークン）を 1,000 回実行

入力トークン数と出力トークン数から、各モデルの費用を計算します。

javascript// Gemini 2.0 Flash の場合
const inputCost = ((1000 * 1000) / 1000000) * 0.1; // $0.10
const outputCost = ((500 * 1000) / 1000000) * 0.4; // $0.20
const totalGemini = inputCost + outputCost; // $0.30

javascript// OpenAI GPT-4o Mini の場合
const inputCost = ((1000 * 1000) / 1000000) * 0.15; // $0.15
const outputCost = ((500 * 1000) / 1000000) * 0.6; // $0.30
const totalOpenAI = inputCost + outputCost; // $0.45

この計算から、Gemini 2.0 Flash の方が 約 33% 安い ことが分かりますね。

ケース 2：長いプロンプト（100,000 入力トークン、10,000 出力トークン）を 100 回実行

javascript// Gemini 2.5 Pro（〜200K トークン）の場合
const inputCost = ((100000 * 100) / 1000000) * 1.25; // $12.50
const outputCost = ((10000 * 100) / 1000000) * 10.0; // $10.00
const totalGemini = inputCost + outputCost; // $22.50

javascript// OpenAI GPT-4o の場合
const inputCost = ((100000 * 100) / 1000000) * 2.5; // $25.00
const outputCost = ((10000 * 100) / 1000000) * 10.0; // $10.00
const totalOpenAI = inputCost + outputCost; // $35.00

長文処理では、Gemini 2.5 Pro の方が 約 36% 安い 結果となりました。

以下の図は、コスト構造の違いを可視化したものです。

mermaidflowchart TB
    subgraph gemini_cost["Gemini のコスト構造"]
        g_input["入力トークン"]
        g_output["出力トークン"]
        g_batch["バッチ割引 50%"]
        g_free["無料枠: 1,500 req/日"]

        g_input --> g_total["総コスト"]
        g_output --> g_total
        g_batch -.->|適用可| g_total
        g_free -.->|適用可| g_total
    end

    subgraph openai_cost["OpenAI のコスト構造"]
        o_input["入力トークン"]
        o_output["出力トークン"]
        o_tools["追加ツール料金"]

        o_input --> o_total["総コスト"]
        o_output --> o_total
        o_tools -.->|Web 検索: $0.02| o_total
    end

この図から、Gemini は バッチ処理と無料枠 でコストを抑えやすく、OpenAI は 追加ツール利用 で料金が加算される可能性があることが分かりますね。

具体例

Gemini CLI でバグ修正を依頼する

実際に Gemini CLI を使ってバグ修正を依頼する例を見てみましょう。

ステップ 1：Gemini CLI のインストール

まず、Gemini CLI をインストールします。

bash# npm 経由でインストール
npm install -g @google/gemini-cli

bash# 認証設定
gemini auth login

認証には Google アカウントが必要です。 Cloud Shell を使う場合は、認証なしで即座に利用できます。

ステップ 2：バグ修正の実行

以下のコマンドで、プロジェクト内のバグを自動修正できます。

bash# ファイルを指定してバグ修正を依頼
gemini "src/utils/parser.ts のバグを修正して"

Gemini CLI は、ファイルを読み込み、問題を分析して修正案を提示します。

typescript// 修正前のコード（バグあり）
function parseData(input: string): number {
  return parseInt(input); // エラーハンドリングがない
}

typescript// Gemini が提案する修正後のコード
function parseData(input: string): number {
  const result = parseInt(input);

  // NaN のチェックを追加
  if (isNaN(result)) {
    throw new Error(`Invalid input: ${input}`);
  }

  return result;
}

このように、エラーハンドリングの追加を自動で提案してくれます。 ReAct ループにより、コードの文脈を理解した上で修正してくれるのが強みですね。

ステップ 3：MCP サーバーと連携した高度な操作

Gemini CLI は、MCP サーバーを使うことで、ファイル操作や外部 API との連携が可能です。

bash# MCP サーバーを指定して実行
gemini --mcp file-server "プロジェクト全体のテストカバレッジを改善して"

MCP サーバーの設定ファイル例を見てみましょう。

json{
  "mcpServers": {
    "file-server": {
      "command": "npx",
      "args": [
        "-y",
        "@modelcontextprotocol/server-filesystem",
        "./src"
      ]
    }
  }
}

この設定により、Gemini CLI は ./src ディレクトリ内のファイルに対して、読み書きや検索を実行できます。

OpenAI Codex CLI でコード生成を行う

次に、OpenAI Codex CLI を使ったコード生成の例です。

ステップ 1：Codex CLI のインストール

OpenAI Codex CLI をインストールします。

bash# npm でインストール
npm install -g @openai/codex-cli

bash# 認証（API キーを標準入力から読み込む）
printenv OPENAI_API_KEY | codex login --with-api-key

ChatGPT Plus、Pro、Business プランに加入している場合は、OAuth 認証も利用可能です。

ステップ 2：対話型 UI での実行

Codex CLI は、デフォルトで対話型 UI を起動します。

bash# 対話型モードで起動
codex

ターミナル上で対話型インターフェースが開き、プロンプトを入力できます。

text> REST API のエンドポイントを作成して

[Codex が生成するコード]

生成されたコードは、以下のような形式で表示されます。

typescript// Express.js を使った REST API エンドポイント
import express from 'express';

const app = express();
app.use(express.json());

// GET エンドポイント
app.get('/api/users', (req, res) => {
  res.json({ users: [] });
});

typescript// POST エンドポイント
app.post('/api/users', (req, res) => {
  const { name, email } = req.body;

  // バリデーション
  if (!name || !email) {
    return res
      .status(400)
      .json({ error: 'Name and email required' });
  }

  res
    .status(201)
    .json({
      message: 'User created',
      data: { name, email },
    });
});

対話型 UI では、生成されたコードをその場で確認し、必要に応じて修正を依頼できますね。

ステップ 3：非対話型での実行（CI/CD 向け）

CI/CD パイプラインで利用する場合は、codex exec を使います。

bash# 非対話型で実行
codex exec "テストファイルを生成して"

このコマンドは、人の介入なしで完了するため、自動化に適しています。

typescript// 生成されたテストファイル例（Jest）
import { parseData } from './parser';

describe('parseData', () => {
  it('should parse valid number string', () => {
    expect(parseData('123')).toBe(123);
  });

  it('should throw error for invalid input', () => {
    expect(() => parseData('abc')).toThrow(
      'Invalid input: abc'
    );
  });
});

codex exec は、codex e というエイリアスでも実行できます。

bash# エイリアスを使った短縮版
codex e "README.md を更新して"

ステップ 4：Web 検索機能を有効化

最新情報を参照しながらコードを生成したい場合は、--search フラグを使います。

bash# Web 検索を有効化して実行
codex --search "Next.js 15 の新機能を使ったサンプルを作成して"

Web 検索機能により、最新のドキュメントやベストプラクティスを反映したコードが生成されます。

ただし、Web 検索には追加料金（$0.02/検索） がかかる点に注意が必要でしょう。

フラグの使い分けパターン

両 CLI のフラグを効果的に使い分けるパターンを整理します。

#	用途	Gemini CLI	OpenAI Codex CLI
1	対話的な開発	`gemini "プロンプト"`	`codex`
2	自動化・CI/CD	通常実行で制御	`codex exec "プロンプト"`
3	Web 検索利用	デフォルトで利用可	`codex --search`
4	モデル変更	`gemini --model gemini-2.0-flash`	`codex --model gpt-4o-mini`
5	セッション再開	チェックポイント機能	`codex --continue [ID]`

以下の図は、両 CLI の典型的な使用フローを示しています。

mermaidflowchart LR
    start["開発タスク発生"]

    start --> mode_choice{実行モード}

    mode_choice -->|対話的| interactive["対話型実行"]
    mode_choice -->|自動化| automation["非対話型実行"]

    interactive --> gemini_i["gemini &quot;プロンプト&quot;"]
    interactive --> openai_i["codex"]

    automation --> gemini_a["gemini &quot;プロンプト&quot;"]
    automation --> openai_a["codex exec &quot;プロンプト&quot;"]

    gemini_i --> result_g["ReAct ループ実行"]
    openai_i --> result_o["TUI で対話"]

    gemini_a --> ci_g["CI/CD 統合"]
    openai_a --> ci_o["CI/CD 統合"]

この図から、Gemini CLI は 対話・非対話で同じコマンド体系 を使い、OpenAI Codex CLI は サブコマンドで明確に分ける アプローチであることが分かりますね。