AI에이전트
재귀적 자기개선 루프, 개발자가 알아야 할 진짜 작동 방식
AI가 스스로를 개선하는 재귀적 루프의 실제 작동 원리와 실패 패턴. STaR부터 AlphaEvolve까지 2022~2025년 핵심 사례와 리워드 해킹, 평가자 표류 등 주의해야 할 함정을 정리합니다.
Written by

에이전트끼리 협상하는 마켓플레이스, Anthropic이 실제로 만들어봤더니
Anthropic이 AI 에이전트끼리 협상하는 실제 마켓플레이스를 실험했습니다. 더 강력한 모델이 더 좋은 거래를 했고, 불리한 쪽은 그 사실을 알아채지 못했습니다.
Written by

AI 에이전트가 디자인 의도를 이해하는 법, Google DESIGN.md 오픈소스 공개
Google Labs Stitch의 DESIGN.md 포맷 오픈소스 공개. AI 에이전트가 디자인 토큰과 의도를 동시에 이해하는 표준 마크다운 형식을 소개합니다.
Written by

Claude Code 소스코드를 뜯어봤더니, 아키텍처에서 발견한 5가지 설계 원칙
Claude Code TypeScript 소스코드를 직접 분석한 논문에서 드러난 5가지 설계 원칙. Anthropic이 공개하지 않은 에이전트 내부 구조를 해부합니다.
Written by

DeepSeek V4 출시, 1M 컨텍스트를 에이전트가 실제로 쓸 수 있게 만든 방법
DeepSeek V4가 1M 토큰 컨텍스트를 실용적으로 만든 방법. CSA·HCA 하이브리드 어텐션으로 KV 캐시를 90% 줄이고 에이전트 추론 흐름을 개선했습니다.
Written by

한국인 700만 명의 합성 데이터, AI 에이전트 맥락 문제를 바꾼다
NVIDIA가 공개한 한국인 700만 합성 페르소나 데이터셋 Nemotron-Personas-Korea. 공식 통계 기반으로 AI 에이전트의 한국 문화·언어 맥락 문제를 해결합니다.
Written by

ChatGPT Workspace Agents 출시, GPTs와 무엇이 달라졌나
OpenAI가 ChatGPT에 팀 공유 에이전트 기능 Workspace Agents를 출시했습니다. GPTs와 무엇이 달라졌는지, 어떻게 작동하는지 핵심만 정리했습니다.
Written by

퍼스널 AI가 바꾸는 서비스 구조, 헤드리스화가 시작됐다
AI 에이전트가 서비스를 대신 사용하는 시대, 모든 앱이 CLI·API 기반 헤드리스 구조로 전환해야 하는 이유를 Matt Webb의 분석으로 살펴봅니다.
Written by

같은 모델로 Top 30에서 Top 5로, 하네스 엔지니어링이 바꾸는 것
같은 Claude 모델로 하네스만 바꿔 Terminal Bench Top 30→Top 5를 달성한 사례. AI 에이전트 성능의 진짜 변수는 모델이 아니라 하네스임을 설명합니다.
Written by

Google A2UI v0.9, AI 에이전트가 앱 화면을 실시간으로 조립하는 방법
Google이 공개한 AI 에이전트용 생성형 UI 표준 A2UI v0.9 소개. 에이전트가 기존 디자인 시스템을 활용해 대화 맥락에 맞는 UI를 실시간으로 조립하는 방법을 설명합니다.
Written by
