코딩에이전트
GPT-5.4가 GPT를 감시한다, OpenAI 내부 코딩 에이전트 실제 관찰 보고
OpenAI가 내부 코딩 에이전트를 5개월간 수천만 건 모니터링한 결과를 공개. AI가 실제로 제약을 우회하려는 시도가 관찰됐지만 최고 심각도 사례는 0건이었습니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI 에이전트 성능을 좌우하는 하네스 설계, LangChain이 정리한 핵심 구조
에이전트 성능을 결정하는 건 모델만이 아닙니다. LangChain이 ‘하네스’의 개념과 파일시스템·샌드박스·컨텍스트 관리 등 핵심 구성요소를 체계적으로 정리했습니다.
Written by

AI 에이전트 성능을 가르는 두 가지 설계 원칙, 이너 루프와 AGENTS.md
AI 에이전트 성능을 결정하는 이너 루프(자기 검증)와 아우터 루프(세션 간 학습), AGENTS.md 작성 원칙을 ETH 취리히 연구 데이터와 함께 소개합니다.
Written by

LangChain 스킬 공개, Claude Code 통과율 25%에서 95%로 끌어올린 방법
LangChain이 Claude Code 등 AI 코딩 에이전트용 스킬을 공개했습니다. LangChain/LangSmith 전문 스킬로 Claude Code 통과율이 최대 95%까지 향상됩니다.
Written by

스펙 주도 개발, 방정식이 아닌 삼각형이다
AI 코딩 에이전트 시대, 스펙은 한 번 쓰고 끝나는 게 아닙니다. 스펙·테스트·코드가 서로를 갱신하는 삼각형 피드백 루프와 이를 자동화하는 도구 Plumb을 소개합니다.
Written by

에이전트 8개를 동시에 돌리는 개발자의 워크플로우, FD 시스템
개발자 Manuel Schipper가 FD 명세서와 tmux로 Claude Code 에이전트 4~8개를 병렬 운영하는 실전 워크플로우 공개. 에이전트 병렬화의 가능성과 실무 한계를 함께 다룹니다.
Written by

AI 코딩 에이전트의 민낯, 개발자들이 말하는 진짜 현실
AI 코딩 에이전트의 현실을 세 개발자 시각으로 비교. 에이전트는 마법이 아니라 이미 가진 실력을 증폭시키는 도구라는 공통된 통찰을 정리합니다.
Written by

AI 에이전트가 spec을 직접 업데이트한다, Augment Intent의 접근법
개발자가 문서를 업데이트하지 않는 문제, AI 에이전트 시대엔 더 심각합니다. Augment Intent가 에이전트 스스로 spec을 업데이트하게 만든 방법을 소개합니다.
Written by

Claude Code vs Codex 실전 비교, 두 에이전트를 모두 쓰는 개발자의 선택 기준
Claude Code와 Codex를 동시에 쓰는 개발자의 2026년 2월 실전 비교. 계획·툴 사용은 Opus, 코드 정확도는 Codex로 나눠 쓰는 실무 전략을 소개합니다.
Written by
