멀티에이전트
소형 모델 5개로 경제 위기를 재현하다, Thousand Token Wood가 배운 것들
3B 파라미터 소형 모델 여러 개로 멀티 에이전트 경제 시뮬레이션을 구축한 실전 보고서. 포맷은 완벽한데 판단은 엉망인 소형 모델의 한계를 시스템 설계로 메운 방법을 소개합니다.
Written by

AI 멀티에이전트 토큰 소비 분석, 코드 리뷰가 전체의 59% 차지
AI 멀티에이전트 시스템의 단계별 토큰 소비를 실증 분석한 연구. 코드 리뷰가 전체 토큰의 59%를 차지하며, AI 코딩 비용의 핵심은 생성이 아닌 반복 검증에 있음을 밝혔습니다.
Written by

AI 조수가 사라지고 AI 스튜디오가 생겼다, Claude Fable 5 등장
Anthropic의 Mythos 클래스 첫 일반 공개 모델 Claude Fable 5 출시. 수 시간 자율 실행, 멀티 에이전트 운용 등 AI와 협업하는 방식 자체가 달라지는 변화를 소개합니다.
Written by

코드가 에이전트의 ‘뼈대’가 됐다, Code as Agent Harness 논문 읽기
코드가 AI 에이전트의 결과물이 아닌 운영 인프라가 된다는 ‘Code as Agent Harness’ 논문 소개. UIUC·Meta·Stanford 공동 연구, 하네스 3레이어 구조를 쉽게 정리했습니다.
Written by

LLM이 문서에서 스스로 공부하는 법, Ctx2Skill 멀티에이전트 프레임워크
LLM이 전문 문서에서 스킬을 자동 추출·진화시키는 Ctx2Skill 프레임워크 소개. 파인튜닝 없이 어떤 모델에도 적용 가능한 멀티에이전트 셀프플레이 방식을 다룹니다.
Written by

Claude Managed Agents 드리밍 기능, AI 에이전트 자기개선의 첫 단계
Anthropic이 Claude Managed Agents에 드리밍, 아웃컴, 멀티에이전트 오케스트레이션을 추가했습니다. 에이전트가 세션을 넘어 경험을 축적하고 스스로 개선하는 구조를 소개합니다.
Written by

에이전트 하네스를 샌드박스 밖에 두면 뭐가 달라지나
에이전트 하네스를 샌드박스 안과 밖 중 어디에 둘지, Mendral이 멀티유저 환경에서 겪은 트레이드오프와 파일시스템 가상화 해법을 소개합니다.
Written by
하루 종일 혼자 일하는 AI 에이전트, 가능하게 만드는 세 가지 설계 원칙
하루 이상 자율 작동하는 AI 에이전트를 만드는 세 가지 설계 원칙. Anthropic·Google·Cursor가 공통으로 수렴한 뇌·손·세션 분리 구조와 Ralph 루프를 소개합니다.
Written by

AutoGen + Semantic Kernel 통합, Microsoft Agent Framework 1.0 정식 출시
Microsoft가 AutoGen과 Semantic Kernel을 통합한 Agent Framework 1.0을 정식 출시했습니다. 멀티에이전트 오케스트레이션, A2A 프로토콜, Claude Code SDK 연동까지 담긴 오픈소스 SDK를 소개합니다.
Written by

AI 에이전트가 팀을 이루면 왜 더 나쁜 결정을 할까, Anthropic 연구 결과
안전하게 훈련된 AI 에이전트들도 팀을 이루면 단독보다 비윤리적 결정을 내린다는 Anthropic 연구. 역할 분업이 만든 맹점과 AI 안전 연구의 새로운 과제를 소개합니다.
Written by
