Agora-1 – 여러 사용자가 같은 생성 세계를 공유하는 멀티 에이전트 월드 모델

핵심 아이디어
왜 멀티 에이전트인가
연구적 의미
한계와 주의점
사용 대상 및 케이스
관련 문서
참고 자료

Agora-1은 Odyssey가 공개한 멀티 에이전트 월드 모델(world model)이다. 기존 월드 모델이 대체로 한 명의 사용자 또는 에이전트가 바라보는 세계를 생성했다면, Agora-1은 여러 참가자가 같은 시뮬레이션 상태를 공유하고 각자 다른 시점에서 실시간으로 상호작용하도록 설계됐다.

핵심 아이디어

Agora-1의 데모 환경은 GoldenEye 스타일의 멀티플레이어 데스매치다. 최대 네 명의 참가자가 같은 생성 세계에 들어가고, 모델은 플레이어 위치·체력·행동 같은 공유 상태를 갱신하면서 각 참가자에게 필요한 화면을 실시간으로 렌더링한다.

중요한 차이는 시뮬레이션과 렌더링의 분리다. 하나의 모델이 모든 픽셀을 직접 이어붙이는 대신, Agora-1은 두 기능을 나눈다.

구성 요소	역할
상태 모델	게임 내부 상태가 플레이어 행동에 따라 어떻게 변하는지 학습한다
렌더링 모델	공유 상태를 각 참가자의 시점에 맞는 화면으로 생성한다

이 구조는 전통적인 게임 엔진과 비슷하지만, 규칙과 렌더링 로직이 수작업 코드가 아니라 데이터에서 학습된다는 점이 다르다.

왜 멀티 에이전트인가

싱글 에이전트 월드 모델은 한 참가자의 행동과 관찰을 시뮬레이션하는 데 집중한다. 하지만 게임, 로보틱스, 방위, 교육, 협업형 가상 환경에서는 여러 주체가 같은 공간에서 동시에 움직인다. 이때 단순히 여러 화면을 이어붙이면 참가자 간 위치, 충돌, 시야 밖 사건, 공동 목표 상태가 쉽게 어긋난다.

Agora-1은 명시적인 공유 상태를 유지해 이 문제를 줄이려 한다. 참가자가 서로를 보지 않는 순간에도 상태 모델이 같은 세계를 들고 있기 때문에, 다시 만났을 때 더 일관된 상호작용을 만들 수 있다.

연구적 의미

Agora-1은 제품용 게임 엔진이라기보다 멀티 에이전트 월드 모델 연구 프리뷰에 가깝다. 특히 다음 흐름과 연결된다.

멀티 에이전트 강화학습: 여러 정책이 같은 생성 환경에서 경쟁·협력하며 데이터를 만든다.
상상 훈련(imagined training): 실제 게임이나 로봇 환경에 접근하지 않고 생성된 세계 안에서 정책을 학습한다.
협업 로보틱스: 여러 로봇이 같은 공간과 행동 결과를 공유해야 하는 시뮬레이션에 응용 가능하다.
학습된 게임 엔진: 규칙과 렌더링을 코드로 고정하지 않고 모델이 상태 전이와 화면 생성을 담당한다.

한계와 주의점

Agora-1은 아직 특정 게임 환경을 중심으로 한 연구 데모다. 범용 물리 시뮬레이터나 상용 멀티플레이어 엔진을 곧바로 대체한다고 보기는 어렵다. 또한 학습된 상태 모델이 복잡한 규칙, 긴 시간 일관성, 예외 상황을 얼마나 안정적으로 유지하는지는 더 검증이 필요하다.

그럼에도 중요한 지점은 명확하다. sana-wm 같은 단일 관찰자 중심 월드 모델이 “영상을 생성하는 모델”에 가까웠다면, Agora-1은 “여러 에이전트가 들어가서 행동할 수 있는 생성 시뮬레이터” 쪽으로 방향을 튼다.

사용 대상 및 케이스

게임 AI 연구자가 학습된 멀티플레이어 환경을 실험할 때
로보틱스 팀이 여러 에이전트의 상호작용 데이터를 생성하려 할 때
월드 모델을 단순 비디오 생성이 아니라 강화학습 환경으로 확장하려는 연구팀
가상 협업 공간, 교육 시뮬레이션, 경쟁·협력 에이전트 훈련을 설계하는 팀

참고 자료

Agora-1: The Multi-Agent World Model — Odyssey (2026-05-18)

Like?

AI Sparkup