Sakana AI 发布 Fugu:不是新大模型,而是把“多模型协同”做成一个模型 API
摘要
日本 AI 公司 Sakana AI 正式发布 Fugu 与 Fugu Ultra。与传统大模型不同,Fugu 本质上是一套学习型多智能体编排系统,可动态调用多个模型协同完成复杂任务。官方称 Fugu Ultra 在部分工程、推理与科研基准上已达到 Fable 5 和 Mythos Preview 水平,但相关成绩目前主要来自官方测试,仍需更多第三方验证。
Sakana AI于2026年6月22日正式发布全新 AI产品 Fugu与 Fugu Ultra。与行业普遍追求更大参数规模不同,Fugu的核心卖点并不是训练出一个更大的基础模型,而是将“多智能体协同(Multi-Agent Orchestration)”封装成一个统一模型接口。对于开发者而言,只需调用一个 OpenAI兼容 API,即可获得多个模型协同工作的能力。

Sakana Fugu 官方产品图,展示其作为单一模型 API 的多智能体系统定位。图片来源:Sakana AI
这一发布之所以引发行业关注,一方面是因为 Sakana AI官方宣称 Fugu Ultra已经能够在部分工程、科学和推理基准测试中与 Anthropic的 Fable 5、Mythos Preview等前沿模型处于同一梯队;另一方面则在于它代表了另一条 AI发展路线:不再依赖单一超大模型,而是通过多个模型之间的动态协作获得更高性能。根据 Sakana AI官方公告,这也是公司首次将其长期研究的多智能体编排技术正式产品化。
Fugu到底是什么?
很多报道把 Fugu描述成“日本版 Claude”或者“日本最强大模型”,这种理解并不准确。
按照 Sakana AI官方介绍,Fugu本身是一种经过训练的协调模型(Coordinator Model)。它能够根据任务需求动态选择不同模型、分配角色、验证结果并汇总输出。用户看到的是一个模型接口,但后台实际上可能同时调用多个不同能力方向的模型协同工作。citeturn1search0turn0search0
简单理解,传统模型像一个全能员工,而 Fugu更像一个项目经理。面对复杂任务时,它会决定应该让谁负责代码、谁负责推理、谁负责验证,然后再把结果整合成最终答案。
官方表示,Fugu甚至能够递归调用自身参与协作,使其形成更加复杂的推理流程。citeturn1search0
为什么行业开始关注“编排模型”?
过去两年,大模型行业主要围绕参数规模、训练数据和算力展开竞争。
但随着 GPT、Claude、Gemini等产品能力逐渐趋近,越来越多研究团队开始关注另一个问题:是否能够通过多个模型合作获得比单一模型更好的结果。
Sakana AI的答案是肯定的。
官方认为未来最强 AI系统不一定是单个超级模型,而可能是多个专业模型形成的“集合智能”。Fugu正是这一思路的商业化产品。官方技术说明显示,其底层研究建立在 TRINITY与 Conductor等多智能体协调研究成果之上。citeturn1search0

Sakana Fugu 架构示意图:通过一个模型 API 调度多个专家模型与智能体。图片来源:Sakana AI
从技术角度看,这种方案有几个潜在优势:
- 能够根据任务动态选择最适合的模型;
- 新模型出现后可快速纳入系统;
- 减少对单一厂商的依赖;
- 在复杂长链任务中可能获得更稳定表现。
不过,这也带来新的问题,例如成本控制、响应延迟、可解释性以及不同模型之间协作失效等挑战。
官方宣称性能达到前沿模型水平
此次最受关注的是 Fugu Ultra的性能声明。
根据 Sakana AI官方公告,Fugu Ultra在工程、科学和推理等多项基准测试中的表现已经能够与 Anthropic的 Fable 5和 Mythos Preview处于同一水平。官方甚至将其描述为“无需依赖单一前沿模型即可获得 Frontier-Level能力”。citeturn1search0turn1search2
但需要强调的是,目前公开传播的大部分性能数据仍来自 Sakana AI自身发布的技术报告和官方材料。
截至发稿时,尚未看到足够数量的独立第三方评测机构对这些成绩进行系统验证。因此,这些结果更适合作为官方声明而非已经被行业广泛确认的事实。
Fugu与传统 AI API有什么不同?
对于开发者而言,最大的变化是接口层面。
传统情况下,如果团队希望构建一个多智能体系统,需要自行完成:
- 模型选择;
- Agent调度;
- 工作流设计;
- 结果验证;
- 成本控制。
而 Fugu的定位则是把这些复杂流程隐藏在系统内部。
开发者只需调用一个 OpenAI兼容接口,剩余工作由 Fugu自动完成。官方表示 Fugu与 Fugu Ultra均通过统一 API提供服务。citeturn0search0turn1search2

Sakana Fugu Ultra 与前沿模型在工程、科学、推理和智能体任务上的基准对比。图片来源:Sakana AI
商业模式与可用性
根据 Sakana AI官网信息,目前产品提供订阅制与按量计费两种模式。
订阅方案最低每月20美元起,同时开放 Fugu与 Fugu Ultra使用权限。企业用户则可采用 Token计费方式。官方同时表示,新出现的前沿模型未来也会持续被纳入 Fugu的模型池中。citeturn0search0
值得注意的是,Sakana AI目前表示产品尚未在欧盟和欧洲经济区全面开放,原因是仍在推进 GDPR等相关合规工作。citeturn0search0
这次发布真正值得关注的是什么
如果只看宣传标题,很容易把 Fugu理解成又一个挑战 GPT或 Claude的大模型。
但从行业角度看,更值得关注的是 Sakana AI试图验证另一种路线:未来 AI竞争未必只是更大的模型和更多算力,也可能是更高效的模型协同机制。
Fugu是否真的能够长期保持与前沿模型相同等级的表现,还有待第三方评测和真实生产环境检验。但它已经向行业展示了一种不同于传统“大模型竞赛”的思路。
对于开发者、AI Agent创业团队以及企业级 AI平台而言,Fugu的意义可能不在于它是不是新的冠军模型,而在于它是否证明了“编排能力”本身也可以成为一种基础模型。
同类栏目导航
没有更多文章