2026年6月22日、Sakana AIが「Sakana Fugu」と上位版「Fugu Ultra」を一般提供(GA)として公開しました。ベータは2026年4月24日に開かれており、今回が正式リリースにあたります。参考: Sakana Fugu: One Model to Command Them All / Sakana Fugu beta
Fuguは、単体の大規模言語モデルというより「複数のモデルを束ねて指揮するモデル」です。Sakana AIはこれを Multi-agent System as a Model(モデルとして振る舞うマルチエージェントシステム)と呼んでいます。1つのAPIエンドポイントの裏側で、タスクに応じて自分で解くか、専門のエージェントに委譲するかを動的に判断します。参考: Sakana Fugu — Multi-agent System as A Model
法人で新しいモデルを評価するとき、見るべきは「賢いか」だけではありません。月末の請求が読めるか、超過課金のリスクをどう抑えるか、そして既存のモデル選定とどう棲み分けるか。この記事では、Fugu / Fugu Ultraの料金体系と公表ベンチマークを、Anthropicが公開しているClaudeの料金と並べて整理します。
Fugu とは何か:オーケストレーションを1モデルに畳み込む
Fuguの中核は、Sakana AIが論文として発表した2つの研究にあります。
- TRINITY — 複数のモデルに対し、ターンごとに「Thinker(考える)」「Worker(作業する)」「Verifier(検証する)」の役割を動的に割り当てる軽量なコーディネーター。
- Conductor — 強化学習によって、エージェントをどう指示し・どう経路づけるかという自然言語の協調戦略そのものを学習させる仕組み。ワークフローを人間が手で設計するのではなく、システム側が「最も性能が出る指揮の仕方」を発見します。
いずれもICLR 2026で発表された研究がベースです。Sakana AIはFuguを、エージェントプールから動的に編成し、役割を割り当て、連携させるモデルとして説明しています。固定的なパイプラインではなく、タスクごとにモデルの組み合わせや処理の進め方を変える点が、従来の「単一モデルAPI」との違いです。参考: Sakana Fugu — Multi-agent System as A Model / SakanaAI/fugu
製品としては2系統に分かれます。
- Fugu — 日常的なタスク向けに、性能と低レイテンシのバランスを取ったモデル。
- Fugu Ultra — AIリサーチやサイバーセキュリティ分析のような、多段の複雑な問題で最大精度を狙うモデル。より深いエージェントプールを協調させます。
料金体系:トークン課金とサブスクの二本立て
Fuguには、従量課金(pay-as-you-go)とサブスクリプションの2つの入口があります。
Fugu Ultra のトークン単価
Fugu Ultra(モデルID fugu-ultra-20260615)のトークン単価は次の通りです(100万トークンあたり・USD)。
| 区分 | 標準コンテキスト | 272Kトークン超 |
|---|---|---|
| 入力 | $5 | $10 |
| 出力 | $30 | $45 |
| キャッシュ入力 | $0.50 | $1.00 |
コンテキスト長が272Kトークンを超えると、入力・出力・キャッシュのいずれもおおよそ倍額になる2段階構成です。長文コンテキストを多用するワークロードでは、この閾値を意識した設計が必要になります。参考: Sakana AI’s Fugu Orchestrates Frontier Models
通常 Fugu は「積み上げない」課金
通常のFuguは、内部で実際に使われたモデルの標準レートで課金されます。Sakana AIは「複数のエージェントが稼働しても料金を積み上げることはなく、関与した最上位モデルに基づく単一レートで課金する」と説明しています。オーケストレーション型は「裏で何モデルも呼ぶぶん割高になるのでは」という懸念が当然出ますが、その点を料金設計で打ち消す形になっています。参考: Sakana Fugu — Multi-agent System as A Model
どのモデルが使われるのか
ここは誤解しやすい点です。Sakana Fuguは「Sakana AI内の1モデルだけを選ぶ」サービスではなく、対応プロバイダー/モデルファミリーのプールを、Fuguがタスクに応じてルーティングする仕組みとして説明されています。公式のGet Startedでは、fuguはデフォルトで「すべての対応プロバイダー」にまたがってルーティングし、APIキー作成・編集時にカスタムモデルプールを有効にすれば、使わせたくないプロバイダーを除外できると説明されています。Get Startedに掲載されているAPIキー作成ダイアログでは、カスタムモデルプールの選択肢として GPT、Claude、Gemini が表示されています。参考: Get Started - Sakana Fugu
重要なのは、ここで表示されているのが GPT、Claude、Gemini というモデルファミリー単位であり、Claude Opus 4.8 や特定の GPT モデル名のような粒度ではないことです。Models APIで公開されているモデルIDも fugu、fugu-ultra、fugu-ultra-20260615 で、裏側の個別モデル名を選ぶAPIにはなっていません。個別モデル単位でどこまで選択・除外できるのか、また将来公開されるのかは、導入判断では重要な論点なので、追加情報が確認でき次第、別途追記・記事化したいところです。参考: Models - Sakana Fugu
つまり、利用者が毎回「今回はOpus」「今回はGPT」と直接指定するというより、Fuguに対してリクエストし、内部の選択はFugu側に任せる設計です。通常版Fuguでは、コンプライアンスやデータ取り扱いの要件に応じて、GPT系、Claude系、Gemini系のようなプロバイダー/モデルファミリー単位でプールから外せます。一方で、Fugu Ultraは性能を出すために全エージェントプールを使う前提で、プールは固定されています。
このとき、OpenAI、Anthropic、GoogleなどのAPIキーを利用者が別途用意してSakanaに登録する、という導線は公式資料上では示されていません。公式手順ではSakana AI Consoleで作成したAPIキーを使い、https://api.sakana.ai にリクエストします。つまり請求・認証の入口はSakana APIであり、その裏側のモデル選択をFuguが担う形です。
ただし、各クエリで実際にどの基盤モデルが使われたかは公開されません。公式FAQでも、Fuguが選んだ具体的なモデルや連携方法は独自技術であり、ルーティング情報は設計上公開しないと説明されています。したがって、この記事では「OpusやGPT-5.5が実際に使われている」と断定せず、「GPT / Claude / Gemini系を含むプールをFuguがルーティングする」と表現するのが安全です。参考: Sakana Fugu FAQ
サブスクリプション 3 プラン
定額で使いたい向けに、月額3プランが用意されています。いずれもFuguとFugu Ultraの両方を含みます。
| プラン | 月額 | 位置づけ |
|---|---|---|
| Standard | $20 | 軽量な日常利用 |
| Pro | $100 | 集中した作業セッション(Standardの約10倍の利用量) |
| Max | $200 | 重い長時間ワークロード(Standardの約20倍の利用量) |
さらに、2026年7月末までに登録すると、初回プランの2か月目が無料になる早期登録特典が案内されています。参考: Sakana Fugu — Multi-agent System as A Model
どう使い始めるのか
現時点で確認できる主な入口は、Sakana AI ConsoleでAPIキーを作成し、OpenAI互換APIとして使う方法です。公式ドキュメントでは、APIエンドポイントは https://api.sakana.ai、モデルIDは fugu、fugu-ultra、バージョン固定用の fugu-ultra-20260615 とされています。参考: Get Started - Sakana Fugu / Models - Sakana Fugu
使い方は大きく3つあります。
- APIとして直接使う。 OpenAI SDKやOpenAI互換のChat Completions / Responses APIから、
base_urlをSakana APIに向けて使います。 - Codex CLIに組み込む。 公式ドキュメントでは
curl -fsSL https://sakana.ai/fugu/install | bashでCodex向け設定を入れ、codex-fuguで起動する手順が案内されています。公式リポジトリにも同じ導線があります。参考: SakanaAI/fugu - 自社のコーディングハーネスや業務アプリに組み込む。 OpenAI互換APIなので、任意のクライアントや社内ツールから呼び出せます。
一方、Claude CodeやGitHub Copilotで、モデル一覧から直接Fuguを選べる公式導線は、今回確認した公式資料上では見つかりませんでした。GitHub CopilotはGitHub側が提供するモデル選択機能の範囲で動くため、任意のOpenAI互換APIを差し込む形とは別に考える必要があります。Claude Codeについても、Sakana AI公式が案内しているのはCodex CLIとカスタムワークフローです。したがって実務上は、まずCodexまたは自社のOpenAI互換クライアントで試すのが現実的です。
使用量については、APIレスポンスでトークン使用量を確認できます。特にFugu Ultraでは、最終出力に使われたトークンとは別に、オーケストレーション内部で使われた入力・出力トークンも usage の詳細フィールドに出ると説明されています。この内部トークンも課金対象に含まれるため、単に最終回答の長さだけを見るのではなく、リクエストごとの total_tokens と詳細フィールドを監視する必要があります。公式FAQでは、トークン使用量と対応コストはリクエストごとに報告され、リアルタイムの支出把握とスケール前の見積もりに使えると説明されています。参考: Models - Sakana Fugu / Pricing - Sakana Fugu
料金比較:Claude の公開価格と並べてみる
Fugu Ultraのトークン単価を、Anthropicが公開しているClaudeの料金(100万トークンあたり)と並べると、立ち位置が見えてきます。
| モデル | 入力 | 出力 |
|---|---|---|
| Fugu Ultra(標準) | $5 | $30 |
| Claude Opus 4.8 | $5 | $25 |
| Claude Fable 5 | $10 | $50 |
入力単価ではFugu UltraはClaude Opus 4.8と同水準、出力単価ではやや高めです。一方、Anthropicの最上位であるFable 5($10 / $50)と比べると、入出力ともに割安に位置します。つまりFugu Ultraは「フロンティア級の性能を、最上位モデルより一段安い単価で」というレンジを狙った価格設定だと読めます。
ここで注意したいのは、Fuguがオーケストレーション型だという点です。複数の対応プロバイダー/モデルを内部で使い分ける設計でも、利用者が見る入口はFugu側の単一APIです。通常版Fuguでは、構成済みプール内で関与した最上位モデルに基づく単一レートで課金されるため、複数モデルを個別契約・個別課金で使い分ける運用と比べたときのコスト見通しのしやすさにつながります。
比較に用いたClaude側の価格はAnthropicが公開している料金(Opus 4.8 = 入力$5 / 出力$25、Fable 5 = 入力$10 / 出力$50、いずれも100万トークンあたり)に基づきます。GPTやGeminiなど他社モデルのトークン単価は本記事では断定せず、性能比較のみで扱います。
性能比較:Sakana 公表のベンチマーク
Sakana AIは、Fugu UltraがFable 5やMythos Previewといった主要モデルと「エンジニアリング・科学・推論の最も厳しいベンチマークで肩を並べる」と主張しています。公表された代表的なスコアは次の通りです。参考: Sakana AI Launches Sakana Fugu
| ベンチマーク | Fugu Ultra | 比較対象 |
|---|---|---|
| SWE-Bench Pro | 73.7 | Claude Opus 4.8: 69.2 / GPT-5.5: 58.6 |
| LiveCodeBench | 93.2 | Fugu: 92.9 / Gemini 3.1 Pro: 88.5 |
| Humanity’s Last Exam | 50.0 | Claude Opus 4.8: 49.8 |
コーディング系のSWE-Bench ProとLiveCodeBench、難問推論のHumanity’s Last Examのいずれでも、Fugu Ultraが比較対象を上回るか拮抗するスコアを示しています。LiveCodeBenchでは通常版Fugu(92.9)もFugu Ultra(93.2)に肉薄しており、軽量側でも十分高い水準にあることがうかがえます。
ただし、これらはあくまでSakana AI側が公表した数値です。比較対象の一部はモデル提供元が公表したスコアであり、Fable 5やMythos Previewは一般提供されていないためFuguのエージェントプールには含まれない、と公式ページでも注記されています。法人での採用判断では、自社の実タスク(実際のリポジトリでのコード修正、社内文書を使った検証など)で再評価することを前提に置くべきです。
法人で見るべき観点
ここまでの整理を踏まえ、法人利用での評価ポイントを3つに絞ります。
1. コスト見通しのしやすさ。 オーケストレーション型は「裏で複数モデルを呼ぶと請求が読めない」リスクがつきものですが、通常版Fuguはプール内の最上位モデルに基づく単一レートで課金する設計でこれを抑えています。Fugu Ultraは固定単価ですが、内部のオーケストレーショントークンも課金対象に含まれるため、リクエストごとの usage を見る運用が必要です。サブスク3プランは固定費でキャップをかけたい組織に向き、従量課金は使用量が読みづらい初期検証に向きます。
2. 272Kトークンの料金境界。 長文コンテキストを常用するワークロード(大規模コードベースの読み込み、長い社内ドキュメントの一括処理など)では、272K超で単価が倍になる点が効いてきます。コンテキスト設計とコストは切り離せません。
3. モデル選定の単純化 vs ベンダーの抽象化。 Fuguの魅力は「1つのAPIで最適なモデルに振り分けてくれる」点ですが、これは裏を返せば、どのモデルがいつ使われているかをSakana AI側に委ねることでもあります。通常版Fuguでは特定プロバイダー/モデルの除外はできますが、各クエリで実際に使われた基盤モデル名は公開されません。透明性と制御を重視する用途では、個別モデルを直接指定する運用と比較検討する価値があります。
まとめ
Sakana Fugu / Fugu Ultraは、「複数のフロンティアモデルを指揮するオーケストレーション層」を単一のモデルAPIとして提供する点に新しさがあります。Fugu Ultraのトークン単価(入力$5 / 出力$30)はClaude Opus 4.8と同等〜やや高め、Anthropic最上位のFable 5よりは割安というレンジで、公表ベンチマークでは主要モデルと拮抗〜上回る水準を示しています。
一方で、ベンチマークは提供元の前提に依存し、内部のモデル選定はベンダーに委ねられます。法人で導入を検討するなら、サブスクと従量課金の使い分け、272Kトークンの料金境界、プロバイダー除外の可否、Codexや自社ツールへの組み込み方、そして自社の実タスクでの再評価をセットで進めるのが現実的です。
フィールフロウでは、こうした新しいモデル・サービスの評価と、自社業務に合わせた選定・組み込みのご相談を承っています。

