こんにちは。ネットアシスト開発部のyu-kinjoです。
さくらのクラウドが提供するAIマネージドAPIサービス「さくらのAI Engine」について、実際に利用するうえでは料金プランを選択する必要が有ります。今回は、さくらのAI Engineが提供する料金プランの違いを解説していきます。
2つの料金プラン
さくらのAI Engineには、2026年3月12日現在「基盤モデル無償プラン」と「従量課金プラン」の2つのプランが提供されています。この2つのプランはさくらのAI Engineのプラン契約画面で以下のように説明されています。

無償と従量課金という事で大きく料金体系が異なりそうですが、基本料金はどちらも0円となっています。また、LLMとテキストのやり取りを行う「チャット生成」やRAGを構築するうえでの「ベクトル埋め込み」、「音声の文字起こし」「音声の読み上げ」が料金内で利用できる上限も同じになっています。つまりこの上限の範囲内であれば、どちらのプランでも無償で利用する事が可能です。
では、どの部分が異なるのでしょうか。「超過分」として記載されている部分について、基盤モデル無償プランでは「レートリミットが適用されます」、従量課金プランでは「入出力トークン数による従量課金」と記載されています。
まず、レートリミットについてですが、こちらは利用超過時に実行するAPIに対してレートリミットが適用される形になります。APIが即座に実行できない可能性が出てきますが、制限があるとはいえ無償で使い続ける事が出来る、お財布にやさしいプランになっています。ただし、「基盤モデル無償プラン」については申し込める上限が有るようです。ご興味がある方はお早めに契約をしておいた方がよいかもしれません。
従量課金の方については、超過分についてトークン数などに応じた料金が発生する形になります。料金面においては基盤モデル無償プランの方がお得に思えますが、レートリミットの適用が困る本番システム内からの呼び出しなどにおいては、従量課金プランを選択した方がよいでしょう。
例えば音声からの文字起こしは50リクエスト/月となっていますが、さくらのAI Engineでの文字起こしでは1リクエストあたり最大30分までですので、1時間の会議内容を文字起こししようとすると約25回で上限にあたる計算になります。
対してチャットの上限は現在3000リクエスト/月となっており、こちらは用途にもよりますが、比較的余裕があるように感じられますね。少人数での軽めのチャットが主な用途で有れば無償の範囲内で利用できる可能性が高そうです。逆に、自動処理・バッチ処理などでテキストを処理し続ける用途なら上限に達する可能性も高いでしょう。
最後に注意点として、RAG利用の為のドキュメント登録を行う際について、どちらのプランでもチャンク(アップロードした文章をベクトルDB用に分割する単位)単位での料金が発生いたします。特に、基盤モデル無償プランでRAG機能を検討する場合はご注意ください。
詳細及び最新の情報は以下をご参照ください。
さくらのAI Engine | さくらのAI | さくらインターネット


