Sakana Fugu – 멀티에이전트 오케스트레이션을 모델 API로 감싼 시스템

핵심 아이디어
아키텍처 관점
사용 예시
어디에 적합한가
관련 문서
참고 자료

Sakana Fugu는 개발자에게는 하나의 모델처럼 보이지만 내부적으로 여러 전문 에이전트를 조율하는 managed API다. LangGraph, AutoGen, CrewAI처럼 개발자가 직접 에이전트 그래프를 짜는 대신, Fugu가 라우팅, 역할 배정, 검증, 최종 합성을 모델 계층에서 처리한다.

핵심 아이디어

일반 멀티에이전트 시스템은 planner, researcher, coder, reviewer, verifier 같은 역할을 애플리케이션 코드에서 직접 설계한다. Fugu는 이 구조를 모델 API 뒤로 숨긴다. 개발자는 OpenAI 호환 SDK에서 model="fugu" 또는 model="fugu-ultra"를 호출하고, 내부 오케스트레이션은 서비스가 맡는다.

옵션	적합한 작업	트레이드오프
Fugu	일반 코딩, 코드 리뷰, 문서 분석, 내부 도우미	품질과 지연 시간 균형
Fugu Ultra	논문 재현, 깊은 기술 리서치, 보안 분석, 복잡한 추론	더 높은 비용과 지연 시간

아키텍처 관점

Fugu는 API 게이트웨이, 오케스트레이터 모델, 에이전트 풀, 동적 라우팅, 검증, 합성 계층으로 이해할 수 있다. 단순 작업은 최소 오케스트레이션으로 처리하고, 복잡한 작업은 여러 전문 에이전트에 나눠 보낸 뒤 검증과 종합을 거친다.

이 방식의 장점은 애플리케이션을 새 프레임워크로 갈아엎지 않고 멀티에이전트 품질을 시험할 수 있다는 점이다. 반대로 관찰 가능성은 더 까다롭다. 내부 에이전트가 어떤 판단으로 움직였는지, 어느 단계가 비용과 지연을 만들었는지 별도 모니터링이 필요하다.

사용 예시

import os
from openai import OpenAI

client = OpenAI(
    api_key=os.environ["FUGU_API_KEY"],
    base_url="https://api.sakana.ai/v1",
)

response = client.responses.create(
    model="fugu-ultra",
    input="이 저장소의 아키텍처 리스크를 분석하고 개선 순서를 제안해라.",
)

print(response.output_text)

어디에 적합한가

Fugu는 단순 Q&A보다 분해, 검증, 합성이 필요한 작업에 맞다. 예를 들어 큰 코드베이스 디버깅, Pull Request 리뷰, 기술 전략 비교, 특허 조사, 논문 재현, 보안 취약점 분석처럼 한 모델의 단발 응답보다 여러 관점의 검토가 유리한 작업이다.

팀은 Fugu가 오케스트레이션을 숨겨준다고 해서 비용·지연·실패 관찰을 생략하면 안 된다. 모델별 품질보다 “성공한 결과 하나당 총 비용”을 기준으로 평가하는 편이 낫다.

참고 자료

Sakana Fugu: Multi-Agent System as a Model — Analytics Vidhya (2026-06-24)

Like?

AI Sparkup