【速報】Sakana AIが2026年6月22日、マルチエージェントAI「Fugu」「Fugu Ultra」を一般公開しました。Fugu Ultraは一部ベンチマークでClaude Fable 5を上回る成績を記録したと発表されています。
日本のAIスタートアップSakana AIが、複数のAIモデルを自動で使い分ける新しいアーキテクチャを発表し、
国内外のAI業界で大きな話題になっています。
「フロンティアモデル不要」ともいえるこのアプローチは、
コストと輸出規制という2つの壁を同時に突き破ろうとするものです。
この記事では、Fuguの仕組み・性能・価格・ユーザーの反応をまとめます。
- Sakana AIが2026年6月22日に「Fugu」「Fugu Ultra」を一般公開
- 複数のAIモデル(GPT・Claude・Gemini等)を自動選択するオーケストレーション型AI
- Fugu UltraはTerminal-Bench 2.1でFable 5超え・GPQA-D 95.1%・LCBv6 93.2%を記録
- Standard月額20ドルから。7月末まで2ヵ月目無料キャンペーン中
Fugu・Fugu Ultraとは?日本のSakana AIが開発したマルチエージェントシステム
Fuguは「複数の最先端AIモデルを1つのAPIで自動的に使い分ける」という設計のAIサービスです。
GPT・Claude・Geminiなど異なるモデルから、
タスクの内容に応じて最適なAIを自動で選択・統合します。
ユーザーは単一のエンドポイントにリクエストを送るだけで、
背後でのモデル選択・統合は自動管理されます。
開発元のSakana AIは、元Google DeepMindの研究者らが設立した東京拠点のスタートアップです。
「進化的アルゴリズム×AIモデルの組み合わせ最適化」という独自路線で注目を集めてきました。
今回のFuguはその研究を実用サービスとして一般公開したものと位置づけられています。
Fuguには2つのグレードがあります。
| モデル | 特徴 | 主な用途 |
|---|---|---|
| Fugu(標準版) | 性能と応答速度のバランスに優れた設計 | 日常業務・チャットボット・コーディング支援 |
| Fugu Ultra(高性能版) | 複雑な多段階問題解決に特化。一部ベンチマークでFable 5超え | AI研究・セキュリティ分析・学術調査 |
【考察】なぜオーケストレーションで「Fable 5越え」が実現できたのか
ここからは編集部の考察(予想)です。
Fugu Ultraが一部ベンチマークでClaude Fable 5を超えたとの発表は、
一見すると驚くべき成果に見えます。
しかしその仕組みを理解すると、これは「自然な帰結」と考えられます。
そう予想する理由は3つあります。
1つ目は「集合知」の構造的優位性です。
単一モデルがどれほど優秀でも、
得意・不得意の分布は必ず存在します。
コード生成が得意なモデル・推論が得意なモデル・日本語品質が高いモデルを
タスクごとに使い分ければ、それぞれの最強部分だけを寄せ集めた「合成最強」が生まれます。
ベンチマークは特定タスクごとの評価が多いため、
オーケストレーション型はベンチマーク上で有利になりやすい構造的特徴があります。
2つ目は「コスト効率の逆転」という発想の転換です。
Anthropic・OpenAI・Googleがフロンティアモデルを作るには
数千億円規模の学習コストがかかります。
一方Sakana AIのアプローチは、
既存の強力なモデルのAPIをオーケストレーションするだけなので、
学習コストは桁違いに小さく、性能は組み合わせで担保できます。
同社が「輸出規制リスクを負うことなくフロンティアレベルを発揮する」と語るのも、
このビジネスモデルの合理性を表していると考えられます。
3つ目は「日本発という文脈の戦略性」です。
米中が主導するAI覇権争いのなかで、
日本のAI産業は独自モデル開発コストを負担する体力に欠けるという現実があります。
Sakana AIの戦略は「作る」より「使いこなして束ねる」ことで差別化する路線であり、
これは国産AIの現実的な生存戦略として評価できます。
実際、Terminal-Bench 2.1(自律的なコーディングタスク)での成績は、
コード生成の得意なモデルを重点的に割り当てた結果と考えれば説明がつきます。
ただし、注意すべき点もあります。
ベンチマーク上の「Fable 5越え」は特定タスクに限定されており、
汎用的な対話・創造的タスクでのFable 5全体との比較ではありません。
また、複数モデルを束ねる構造上、トークン消費量が増加し費用対効果が変わる可能性があります。
「最強AIを安く使える」というより「特定用途で最大効率を出せる設計」と見るのが正確ではないでしょうか。
いずれにせよ、Fuguのアーキテクチャが示す「モデルを作らずに超える」という発想は、
今後のAI産業の競争軸を変えうる重要なアプローチだと考えられます。
これは予想であり、今後の実使用データによって評価が変わりうる点はご留意ください。
Fugu Ultraのベンチマーク成績と性能
Fugu Ultraは複数の主要ベンチマークで高い成績を記録していると報告されています。
特に自律コーディングタスクでの評価が高く、
ベータテストでは「他モデルが見逃すバグを20件以上検出した」という実績も報告されています。
| ベンチマーク | Fugu Ultraのスコア | 比較 |
|---|---|---|
| Terminal-Bench 2.1(自律コーディング) | Fable 5超え | 自律的なコーディング能力を測定 |
| GPQA-D(科学的推論) | 95.1% | フロンティアモデル水準 |
| LCBv6(コード生成) | 93.2% | 高精度のコード生成能力 |
Fuguの価格プランと使い方
Fuguはサブスクリプション型と従量課金型の両方で提供されています。
月額プランはStandard・Pro・Maxの3段階で、
2026年7月末までに登録すると2ヵ月目が無料になるキャンペーンを実施中とのことです。
| プラン | 月額料金 | 目安 |
|---|---|---|
| Standard | $20(約3,200円) | 個人・軽い業務利用 |
| Pro | $100(約16,000円) | 中規模チーム・ヘビーユーザー |
| Max | $200(約32,000円) | 大規模利用・業務自動化 |
| API従量課金 | 入力$5・出力$30/100万トークン | 開発者向け |
使い方はシンプルで、既存のOpenAI互換のAPIエンドポイントと高い互換性があると報告されています。
GPTを使ったコードをほぼそのまま流用できるケースも多く、
乗り換えコストが低い点が評価されています。
ユーザーの反応と懸念点
2026年6月22日のリリース後、X(旧Twitter)ではtweet数454件が確認されており、
ITビジネス層を中心に活発な議論が展開されています。
- 「コードレビューで他のAIが見落とすバグを検出できた」
- 「日本語の出力が自然で読みやすい」
- 「国産AIの現実的な方向性として評価できる」
- 「OpenAI互換なので既存コードをほぼそのまま移行できた」
- 「複数モデルを束ねる分、トークン消費が重い」
- 「Pro・Max プランの価格が高い」
- 「ベータテストでタイムアウトが発生したケースがある」
- 「既存大手モデルとの依存関係が生じるリスク」
Sakana AI「Fugu」に関するQ&A
Q1. Fuguは日本語に対応していますか?
対応しています。
ベータテスト参加者からも「日本語の出力が自然で読みやすい」との評価が報告されています。
日本語タスクを含む業務自動化にも活用できると考えられています。
Q2. 既存のOpenAI APIからFuguへの移行は難しいですか?
比較的容易とされています。
FuguはOpenAI互換のAPIエンドポイントを採用しており、既存コードをほぼそのまま流用できるケースが多いと報告されています。
ただし、モデル固有のパラメータや出力形式には差異が生じる可能性があるため、
本番環境への移行前にはテストが推奨されます。
Q3. 「Fable 5越え」はどのタスクでの話ですか?
Terminal-Bench 2.1(自律的なコーディングタスク)での比較とされています。
汎用的な対話や創造性のタスク全体での比較ではない点に注意が必要です。
GPQA-D(科学的推論)で95.1%・LCBv6(コード生成)で93.2%という数値も報告されており、
コーディング・推論系の業務での強みが特に注目されています。
Q4. Fuguを使うと費用はどのくらいかかりますか?
個人利用はStandardプラン月額$20(約3,200円)から開始できます。
2026年7月末までに登録すると2ヵ月目が無料になるキャンペーン中とのことです。
ただし、複数モデルを束ねる構造上トークン消費が多くなる場合があり、
API従量課金(入力$5・出力$30/100万トークン)での利用は用途によってコスト増になる可能性があります。
Q5. Sakana AIとはどんな会社ですか?
Sakana AIは2023年に設立された東京拠点のAIスタートアップです。
元Google DeepMindの研究者らが中心となって設立し、
進化的アルゴリズムを用いたAIモデルの自動設計・最適化を研究してきました。
「大規模な学習コストをかけずに高性能なAIを実現する」という独自路線で注目を集めており、
今回のFuguはその成果を実用サービスとして一般公開したものと位置づけられています。
Q6. Fuguは輸出規制の影響を受けますか?
Sakana AI自身は「輸出規制のリスクを負うことなくフロンティアレベルの実力を発揮する」と説明しています。
日本国内での開発・運用を基本としており、
米中の半導体輸出規制が直接の障壁になりにくい設計とされています。
ただし、オーケストレーション対象とする外部モデル(GPT・Claude等)の利用条件は各プロバイダーの規約に従います。
まとめ
Sakana AIのFuguは「モデルを作らずに束ねて超える」という新しいアプローチで、一部ベンチマークでClaude Fable 5を超えたと発表されています。
コーディング・推論系タスクでの高い評価、OpenAI互換の使いやすさ、
そして輸出規制リスクを回避した日本発の設計が注目を集めています。
Standard月額$20からスタートでき、
7月末まで2ヵ月目無料のキャンペーン中です。
コーディング支援・業務自動化・AI研究など特定の用途では試す価値があると考えられます。
続報が入り次第、追記します。