코딩에이전트
Claude Code가 장악한 시장, OpenAI가 꺼낸 Codex 플러그인 전략
OpenAI가 Claude Code 안에서 Codex를 사용할 수 있는 플러그인을 출시했습니다. 코딩 도구 시장 전략 전환의 배경과 의미를 정리했습니다.
Written by

Gemini API Agent Skill, 코딩 성공률 28%에서 96%로 끌어올린 방법
Google DeepMind가 AI 코딩 에이전트의 지식 공백 문제를 해결하는 Agent Skill을 개발. Gemini 3.1 Pro의 성공률이 28.2%에서 96.6%로 향상된 과정을 소개합니다.
Written by

GPT-5.4가 GPT를 감시한다, OpenAI 내부 코딩 에이전트 실제 관찰 보고
OpenAI가 내부 코딩 에이전트를 5개월간 수천만 건 모니터링한 결과를 공개. AI가 실제로 제약을 우회하려는 시도가 관찰됐지만 최고 심각도 사례는 0건이었습니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI 에이전트 성능을 좌우하는 하네스 설계, LangChain이 정리한 핵심 구조
에이전트 성능을 결정하는 건 모델만이 아닙니다. LangChain이 ‘하네스’의 개념과 파일시스템·샌드박스·컨텍스트 관리 등 핵심 구성요소를 체계적으로 정리했습니다.
Written by

AI 에이전트 성능을 가르는 두 가지 설계 원칙, 이너 루프와 AGENTS.md
AI 에이전트 성능을 결정하는 이너 루프(자기 검증)와 아우터 루프(세션 간 학습), AGENTS.md 작성 원칙을 ETH 취리히 연구 데이터와 함께 소개합니다.
Written by

LangChain 스킬 공개, Claude Code 통과율 25%에서 95%로 끌어올린 방법
LangChain이 Claude Code 등 AI 코딩 에이전트용 스킬을 공개했습니다. LangChain/LangSmith 전문 스킬로 Claude Code 통과율이 최대 95%까지 향상됩니다.
Written by

스펙 주도 개발, 방정식이 아닌 삼각형이다
AI 코딩 에이전트 시대, 스펙은 한 번 쓰고 끝나는 게 아닙니다. 스펙·테스트·코드가 서로를 갱신하는 삼각형 피드백 루프와 이를 자동화하는 도구 Plumb을 소개합니다.
Written by

에이전트 8개를 동시에 돌리는 개발자의 워크플로우, FD 시스템
개발자 Manuel Schipper가 FD 명세서와 tmux로 Claude Code 에이전트 4~8개를 병렬 운영하는 실전 워크플로우 공개. 에이전트 병렬화의 가능성과 실무 한계를 함께 다룹니다.
Written by

AI 코딩 에이전트의 민낯, 개발자들이 말하는 진짜 현실
AI 코딩 에이전트의 현실을 세 개발자 시각으로 비교. 에이전트는 마법이 아니라 이미 가진 실력을 증폭시키는 도구라는 공통된 통찰을 정리합니다.
Written by
