はじめての Ollama：`ollama run llama3` でチャットを動かす 10 分チュートリアル

2025年11月15日

Ollama

はじめての Ollama：`ollama run llama3` でチャットを動かす 10 分チュートリアル

ローカル環境で AI とチャットできたら、インターネット接続を気にせず、プライバシーも守られて安心ですよね。Ollama を使えば、わずか 10 分でローカル LLM を動かすことができます。本記事では、Ollama のインストールから ollama run llama3 コマンドでチャットを開始するまでの手順を、初心者の方にもわかりやすく解説します。

背景

Ollama とは何か

Ollama は、ローカル環境で大規模言語モデル（LLM）を簡単に実行できるツールです。OpenAI の ChatGPT や Claude などのクラウドサービスとは異なり、完全にローカルで動作するため、以下のようなメリットがあります。

#	メリット	説明
1	プライバシー保護	データが外部に送信されない
2	オフライン動作	インターネット接続が不要
3	コスト削減	API 料金が発生しない
4	カスタマイズ性	モデルの選択や調整が自由

Llama3 モデルの特徴

Llama3 は Meta 社が開発したオープンソースの LLM で、多言語対応かつ高性能な応答が特徴です。サイズも複数用意されており、個人の PC でも動作する軽量版から、より高性能な大規模版まで選択できます。

以下の図は、Ollama を使った LLM 実行の基本的な流れを示しています。

mermaidflowchart LR
  user["ユーザー"] -->|"ollama run llama3"| cli["Ollama CLI"]
  cli -->|モデル読み込み| model["Llama3<br/>モデル"]
  model -->|推論処理| cli
  cli -->|応答表示| user

この仕組みにより、クラウドサービスに頼らず、自分の PC 上で AI との対話が実現できます。

課題

ローカル LLM 実行のハードル

従来、ローカル環境で LLM を動かすには、以下のような課題がありました。

#	課題	詳細
1	複雑なセットアップ	Python 環境、ライブラリ、モデルファイルの手動管理が必要
2	専門知識の必要性	CUDA、GPU ドライバーなどの理解が求められる
3	時間のかかる準備	環境構築だけで数時間かかることも
4	エラー対応の難しさ	依存関係のトラブルシューティングが複雑

これらの課題が、多くの開発者にとってローカル LLM の導入を躊躇させる要因となっていました。

初心者が直面する壁

特に、機械学習や AI 開発の経験が浅い方にとっては、以下のような壁が存在します。

モデルの選び方: どのモデルを選べば良いのか判断が難しい
リソース要件: 自分の PC で動作するか不安
コマンド操作: ターミナルやコマンドラインに不慣れ

以下の図は、従来の方法と Ollama を使った方法の違いを示しています。

mermaidflowchart TB
  subgraph traditional["従来の方法"]
    t1["Python 環境構築"] --> t2["ライブラリインストール"]
    t2 --> t3["モデルダウンロード"]
    t3 --> t4["設定ファイル作成"]
    t4 --> t5["実行スクリプト記述"]
  end

  subgraph ollama_way["Ollama の方法"]
    o1["Ollama インストール"] --> o2["ollama run llama3"]
  end

  traditional -.->|"複雑で時間がかかる"| result1["実行まで数時間"]
  ollama_way -.->|"シンプルで速い"| result2["実行まで10分"]

Ollama はこれらの課題を解決し、誰でも簡単にローカル LLM を利用できる環境を提供します。

解決策

Ollama が提供する簡単セットアップ

Ollama は、ワンコマンドでモデルのダウンロードから実行まで完結する設計になっています。主な特徴は以下の通りです。

#	特徴	説明
1	オールインワン	必要な依存関係がすべて含まれる
2	自動最適化	GPU/CPU を自動検出して最適化
3	モデル管理	モデルのダウンロード・更新を自動化
4	シンプルな CLI	覚えやすいコマンド体系

ollama run コマンドの仕組み

ollama run llama3 というシンプルなコマンドの裏側では、以下の処理が自動的に実行されます。

mermaidsequenceDiagram
  participant User as ユーザー
  participant CLI as Ollama CLI
  participant Cache as ローカルキャッシュ
  participant Server as Ollama サーバー
  participant Model as モデル実行環境

  User->>CLI: ollama run llama3
  CLI->>Cache: モデル存在確認
  alt モデルが未ダウンロード
    Cache-->>CLI: 存在しない
    CLI->>Server: モデルダウンロード
    Server-->>CLI: llama3 モデル
    CLI->>Cache: モデル保存
  else モデル済み
    Cache-->>CLI: モデル読み込み
  end
  CLI->>Model: モデル起動
  Model-->>CLI: 準備完了
  CLI-->>User: チャット開始

この自動化により、ユーザーは複雑な手順を意識することなく、すぐに AI とチャットを始められます。

必要なシステム要件

Llama3 を快適に動かすための推奨要件は以下の通りです。

#	項目	推奨スペック	最小スペック
1	RAM	16GB 以上	8GB
2	ストレージ	10GB 以上の空き容量	5GB
3	CPU	4 コア以上	2 コア
4	GPU	任意（あれば高速）	不要

RAM が 8GB の環境でも動作しますが、応答速度を考慮すると 16GB 以上が快適です。

具体例

ステップ 1：Ollama のインストール

それでは、実際に Ollama をインストールしていきましょう。OS ごとにインストール方法が異なります。

macOS の場合

macOS では、公式サイトからインストーラーをダウンロードするのが最も簡単です。

bash# Homebrew を使う方法（推奨）
brew install ollama

Homebrew でインストールすると、依存関係も自動的に解決されます。インストールが完了したら、バージョンを確認してみましょう。

bash# バージョン確認
ollama --version

正常にインストールされていれば、ollama version 0.x.x のような出力が表示されます。

Linux の場合

Linux では、公式のインストールスクリプトを使用します。

bash# Ollama インストールスクリプト実行
curl -fsSL https://ollama.com/install.sh | sh

このスクリプトは、システムに必要なパッケージを自動的にインストールしてくれます。

bash# インストール確認
which ollama

/usr/local/bin/ollama のようなパスが表示されれば成功です。

Windows の場合

Windows では、公式サイト（https://ollama.com/download）から Windows 用インストーラーをダウンロードして実行します。

インストール後、PowerShell またはコマンドプロンプトで以下を実行します。

powershell# バージョン確認
ollama --version

正常に表示されれば、インストールは完了です。

ステップ 2：Ollama サービスの起動

Ollama は、バックグラウンドでサーバーとして動作します。インストール後、自動的に起動することが多いですが、手動で起動する場合は以下のコマンドを使います。

bash# Ollama サービス起動（バックグラウンド）
ollama serve

このコマンドを実行すると、Ollama サーバーがポート 11434 で起動します。別のターミナルウィンドウを開いて、次のステップに進みましょう。

bash# サービス起動確認
curl http://localhost:11434

Ollama is running というメッセージが返ってくれば、サーバーは正常に動作しています。

ステップ 3：Llama3 モデルの実行

いよいよ、Llama3 を動かしてみます。このステップでは、モデルのダウンロードと実行が同時に行われます。

bash# Llama3 モデルを実行（初回はダウンロードも実行される）
ollama run llama3

初回実行時には、Llama3 モデル（約 4GB）のダウンロードが始まります。ネットワーク速度にもよりますが、5〜10 分程度かかることがあります。

ダウンロード中は、以下のような進捗が表示されます。

textpulling manifest
pulling 6a0746a1ec1a... 100% ▕████████████████▏ 4.7 GB
pulling 4fa551d4f938... 100% ▕████████████████▏  12 KB
pulling 8ab4849b038c... 100% ▕████████████████▏  254 B
pulling 577073ffcc6c... 100% ▕████████████████▏  110 B
pulling 3f8eb4da87fa... 100% ▕████████████████▏  485 B
verifying sha256 digest
writing manifest
removing any unused layers
success

ダウンロードが完了すると、自動的にチャットモードに入ります。

ステップ 4：チャットの開始

モデルの準備が整うと、以下のようなプロンプトが表示されます。

text>>>

この状態で、自由にメッセージを入力できます。日本語でも英語でも対応していますので、試してみましょう。

text>>> こんにちは！あなたは何ができますか?

Llama3 が応答を生成し、以下のような返答が表示されます。

textこんにちは!私は大規模言語モデルで、様々なタスクをお手伝いできます。

主な機能:
- 質問への回答
- 文章の要約や翻訳
- コード生成やデバッグ支援
- アイデアのブレインストーミング
- 一般的な会話

何かお手伝いできることはありますか?

このように、自然な会話形式で AI とやり取りができます。

ステップ 5：チャットの終了と再開

チャットを終了するには、以下のコマンドを入力します。

text>>> /bye

または、Ctrl + D（Windows では Ctrl + Z）を押すことでも終了できます。

再度チャットを始めたい場合は、同じコマンドを実行するだけです。

bash# 再度 Llama3 を起動
ollama run llama3

2 回目以降は、モデルが既にダウンロードされているため、すぐにチャットが開始されます。

ステップ 6：その他の便利なコマンド

Ollama には、モデル管理に便利なコマンドがいくつか用意されています。

bash# ダウンロード済みモデルの一覧表示
ollama list

このコマンドで、ローカルに保存されているモデルを確認できます。

textNAME            ID              SIZE    MODIFIED
llama3:latest   a6990ed6be41   4.7 GB  2 minutes ago

不要になったモデルを削除する場合は、以下のコマンドを使います。

bash# モデルの削除
ollama rm llama3

ストレージ容量が気になる場合に便利です。

モデルを明示的にダウンロードだけしておきたい場合は、pull コマンドを使います。

bash# モデルのダウンロードのみ実行
ollama pull llama3

これにより、実行前にモデルを準備しておくことができます。

実行フローの全体像

ここまでの手順を、以下の図でまとめます。

mermaidflowchart TD
  start["開始"] --> install["Ollama インストール"]
  install --> serve["ollama serve<br/>サービス起動"]
  serve --> run["ollama run llama3<br/>実行"]

  run --> check{初回実行?}
  check -->|Yes| download["モデルダウンロード<br/>（4.7GB）"]
  check -->|No| chat["チャット開始"]
  download --> chat

  chat --> input["メッセージ入力"]
  input --> response["AI からの応答"]
  response --> continue{続ける?}
  continue -->|Yes| input
  continue -->|No| end_chat["/bye で終了"]
  end_chat --> finish["完了"]

この流れに沿って進めれば、誰でも簡単に Ollama と Llama3 を使い始められます。

実践例：コード生成を依頼する

実際の活用例として、Llama3 にコード生成を依頼してみましょう。

text>>> JavaScriptで配列の重複を削除する関数を書いてください

すると、以下のようなコードが生成されます。

textもちろんです!配列の重複を削除する関数をいくつかの方法でご紹介します。

方法1: Setを使う方法（最もシンプル）

function removeDuplicates(arr) {
  return [...new Set(arr)];
}

方法2: filterを使う方法

function removeDuplicates(arr) {
  return arr.filter((item, index) => arr.indexOf(item) === index);
}

使用例:
const numbers = [1, 2, 2, 3, 4, 4, 5];
console.log(removeDuplicates(numbers)); // [1, 2, 3, 4, 5]

このように、プログラミングの補助ツールとしても活用できます。

まとめ

Ollama を使えば、わずか数ステップでローカル環境に AI チャットボットを構築できます。本記事で紹介した ollama run llama3 コマンドは、初心者でも簡単に実行でき、10 分程度で AI との対話を始められるでしょう。

改めて、手順を振り返ります。

#	ステップ	所要時間
1	Ollama のインストール	1〜2 分
2	サービスの起動確認	1 分
3	Llama3 のダウンロード・実行	5〜10 分（初回のみ）
4	チャット開始	即座