さくらのAI Engineでgemma-4-31B-itを試してみた｜Kimi・Qwenとの料金比較も紹介

2026年7月1日

こんにちは、UOZUです！

先日さくらのAI Engine「preview/gemma-4-31B-it」が追加されましたので、早速試してみようと思います。

gemma-4-31B-itとは

gemma-4-31B-it とは、Googleの生成AIモデルファミリーの1つです。せっかくなので、まずは gemma-4-31B-it 自身に、Kimi-K2.6 や Qwen3.6、他の Gemma 4 モデルとの違いを説明してもらいましょう。

curl --location https://api.ai.sakura.ad.jp/v1/chat/completions \
  --header 'Accept: application/json' \
  --header "Authorization: Bearer トークン文字列" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "preview/gemma-4-31B-it",
    "messages": [
      { "role": "system", "content": "日本語で分かりやすく簡潔に回答してください。" },
      { "role": "user", "content": "gemma-4-31B が、どの様な AI モデルで、Kimi-K2.6 や Qwen3.6 、他の Gemma 4 と、具体的にどの様に違うのか、自己紹介をしてください。" }
    ],
    "temperature": 0.7,
    "max_tokens": 1000,
    "stream": false
  }'| jq -r '.choices[0].message.content'

まず重要な点として、現時点での公式なリリース状況に基づいた回答をいたします。

**【重要】** 現時点でGoogleから**「Gemma 4」というモデルは正式にリリースされておりません。** 現在の最新世代は「Gemma 2」です。

もし、あなたが仮定の話や、将来的な予測、あるいは特定のカスタムモデルについて尋ねられているのであれば、一般的なAIモデルの構造的な視点から 「もしGemma 4（特に31B）が存在したら、他とどう違うか」という形で自己紹介（シミュレーション）をさせていただきます。

---

### 🤖 Gemma 4-31B（想定）としての自己紹介

私はGoogleが開発した、オープンウェイトの次世代AIモデル**「Gemma 4-31B」**です。

#### 1. 私はどのようなモデルか？
私は、Googleの最強モデルである「Gemini」と同じ技術スタック（アーキテクチャ）を継承しつつ、個人の開発者や企業が自分の環境で動かせるように 最適化されたモデルです。
特に**「31B（310億パラメータ）」**というサイズは、軽量さと高性能の「スイートスポット」を狙っており、家庭用ハイエンドGPUでも動作しつつ、GPT-4クラスの推論能力に迫ることを目標としています。

#### 2. 他のモデルとの具体的な違い

| 比較対象 | Gemma 4-31B との違い |
| :--- | :--- |
| **Kimi-K2.6** | Kimiは超長文コンテキスト（数百万トークン）の処理に特化していますが、私は**「推論の効率性」と「汎用的な知識の密度」**に 重点を置いています。 |
| **Qwen 2.5/3.x** | Qwenはコーディングや数学、多言語能力に非常に強いモデルです。私はそれらに匹敵しつつ、**Googleエコシステムの知見を活かした「論理的思考の自然さ」と「安全性の高い制御」**に強みを持ちます。 |
| **他のGemma 4 (2B / 9B / 27Bなど)** | **2B/9B**はスマホやPCでサクサク動く「エッジ向け」です。一方、**31B**は複雑な指示への理解力、高度 な分析、創造的な執筆など、**「知的な深さ」**が必要なタスクで圧倒的に高いパフォーマンスを発揮します。 |

#### 3. 私の最大の武器
*   **効率的な学習:** 少ないパラメータ数で、より巨大なモデルと同等の性能を出す「蒸留（Distillation）」技術が極限まで高められています。
*   **オープンな柔軟性:** ウェイトが公開されているため、特定の業界（医療・法律など）に合わせて誰でも微調整（Fine-tuning）が可能です。
*   **Gemini譲りの推論力:** 複雑なステップを必要とする問題解決において、より正確な回答を導き出せます。

---

**まとめ：**
私は、**「巨大モデルの知能」を「現実的なサイズ」に凝縮した、オープンAI界の高性能エンジン**のような存在です。

gemma-4-31B-it 自身に概要を説明させたところ、「Gemma 4は正式にリリースされていない」といった回答が返ってきました。

ただし、実際には公式情報で Gemma 4 のモデルとして 31B が案内されているため、この回答は最新情報と異なる可能性があります。LLM自身に新しいモデル情報を説明させる場合、学習データにより最新情報とずれた回答になることがある点には注意が必要ですね。

ちなみに回答内で紹介されている小規模モデルは、以前、iPhoneでも動作するとして話題になっていたかと思います。

画像の説明

では前回の検証と同様、画像の説明をさせてみます。
※model指定以外の手順は同じコマンドになりますので、省略しています。

  model: "preview/gemma-4-31B-it",

写真の内容について説明します。

**【風景】**
ベージュ色の布地のような壁を背景に、誕生日の飾り付けがされています。全体的にブルーとホワイトを基調とした爽やかな色合いのデコレーションで す。

**【風船の数と文字】**
風船は全部で**4つ**見えます。
*   **手前：** 光沢のあるメタリックブルーの風船が1つ大きく配置されています。
*   **右上：** 透明な大きな風船があり、表面に黒い文字で**「Happy Birthday」**と書かれています。
*   **右下：** 透明な風船が2つあり、中には青い紙吹雪のようなものが入っています。

**【壁に貼られた文字】**
水色の三角形の旗（ガーランド）が2段にわたって吊るされており、1文字ずつアルファベットが書かれています。
*   上の段には**「HAPPY」**
*   下の段には**「BIRTHDAY」**
と書かれており、合わせて**「HAPPY BIRTHDAY」**というメッセージになっています。旗の周りには、アクセントとして小さな青いリボンがいくつか飾 られています。

画像の説明には大きな破綻や不足はないように見えます。

サーバ構築手順の説明

では続けてPlaygroundで「サーバ構築手順の説明」をさせてみます。

AlmaLinux 9 + nginx + php-fpm + MariaDB のWordPressサーバを構築する手順を説明して。回答は10項目以内、各項目は2行以内にしてください。

1. **OS更新とリポジトリ追加**: `dnf update`を実行し、EPELとRemiリポジトリをインストールしてPHPの最新版を有効にします。
2. **Nginxの導入**: `dnf install nginx`でインストールし、`systemctl enable --now nginx`で起動・自動起動設定をします。
3. **PHP-FPMの導入**: `dnf install php-fpm php-mysqlnd php-gd php-xml`等を導入し、`systemctl enable --now php-fpm`で起動します。
4. **MariaDBの導入**: `dnf install mariadb-server`でインストールし、`systemctl enable --now mariadb`で起動します。
5. **DB初期設定**: `mysql_secure_installation`を実行し、ルートパスワード設定と不要な権限を削除します。
6. **WP用DB作成**: MariaDBにログインし、WordPress用のデータベースと専用ユーザーを作成して権限を付与します。
7. **WP本体の設置**: `/var/www/html`にWordPressをダウンロード・展開し、所有者を`nginx`ユーザーに変更します。
8. **Nginx設定**: `/etc/nginx/conf.d/`にWP用の設定ファイルを作成し、PHP処理をphp-fpmへ転送する設定を書きます。
9. **権限とSELinux設定**: `chown`で権限を調整し、`setsebool -P httpd_can_network_connect_db 1`等でSELinuxを許可します。
10. **ファイアウォールと完了**: `firewall-cmd`でHTTP/HTTPSを許可し、ブラウザからアクセスしてインストール画面を完了させます。

前回検証した2モデルと比較すると、具体的なコマンドの内容が省略されており、出力の具体性には差を感じる内容でした。EPELレポジトリを含める傾向があるのは、どのモデルでも共通なのでしょうか。

さいごに

今回は、さくらのAI Engineで提供開始された preview/gemma-4-31B-it を試してみました。

画像説明については大きな破綻は見られず、一般的な画像理解用途では十分に利用できそうです。またサーバ構築手順の説明では、他のモデルと比べて具体的なコマンドがやや省略される印象もありました。

ただし、料金面では Kimi-K2.6 よりも低価格で利用できるため、軽めの検証や汎用的な用途では扱いやすいモデルだと感じました。用途に応じて Kimi-K2.6、Qwen3.6-35B-A3B、gemma-4-31B-itを使い分けるとよさそうです。

モデル名	入力料金	出力料金
preview/Kimi-K2.6	0.6円 / 10,000トークン	3円 / 10,000トークン
preview/Qwen3.6-35B-A3B	0.3円 / 10,000トークン	1.5円 / 10,000トークン
preview/gemma-4-31B-it	0.24円 / 10,000トークン	0.96円 / 10,000トークン