코딩에이전트
Qwen3.6-Plus, 에이전틱 코딩 강화해 Claude Opus 4.5급 성능 도달
Alibaba Qwen 팀이 에이전틱 코딩에 특화된 Qwen3.6-Plus를 공개했습니다. Claude Opus 4.5급 성능을 내세우며 독점 모델 전략으로 전환하는 배경을 소개합니다.
Written by

AI 에이전트 한 명에서 팀으로, 개발자 역할이 바뀌고 있다
AI 코딩 에이전트를 팀처럼 조율하는 멀티 에이전트 패턴 소개. 서브에이전트, 에이전트 팀, 품질 게이트 등 구글 엔지니어 Addy Osmani의 실전 전략.
Written by

Claude Code가 장악한 시장, OpenAI가 꺼낸 Codex 플러그인 전략
OpenAI가 Claude Code 안에서 Codex를 사용할 수 있는 플러그인을 출시했습니다. 코딩 도구 시장 전략 전환의 배경과 의미를 정리했습니다.
Written by

Gemini API Agent Skill, 코딩 성공률 28%에서 96%로 끌어올린 방법
Google DeepMind가 AI 코딩 에이전트의 지식 공백 문제를 해결하는 Agent Skill을 개발. Gemini 3.1 Pro의 성공률이 28.2%에서 96.6%로 향상된 과정을 소개합니다.
Written by

GPT-5.4가 GPT를 감시한다, OpenAI 내부 코딩 에이전트 실제 관찰 보고
OpenAI가 내부 코딩 에이전트를 5개월간 수천만 건 모니터링한 결과를 공개. AI가 실제로 제약을 우회하려는 시도가 관찰됐지만 최고 심각도 사례는 0건이었습니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI 에이전트 성능을 좌우하는 하네스 설계, LangChain이 정리한 핵심 구조
에이전트 성능을 결정하는 건 모델만이 아닙니다. LangChain이 ‘하네스’의 개념과 파일시스템·샌드박스·컨텍스트 관리 등 핵심 구성요소를 체계적으로 정리했습니다.
Written by

AI 에이전트 성능을 가르는 두 가지 설계 원칙, 이너 루프와 AGENTS.md
AI 에이전트 성능을 결정하는 이너 루프(자기 검증)와 아우터 루프(세션 간 학습), AGENTS.md 작성 원칙을 ETH 취리히 연구 데이터와 함께 소개합니다.
Written by

LangChain 스킬 공개, Claude Code 통과율 25%에서 95%로 끌어올린 방법
LangChain이 Claude Code 등 AI 코딩 에이전트용 스킬을 공개했습니다. LangChain/LangSmith 전문 스킬로 Claude Code 통과율이 최대 95%까지 향상됩니다.
Written by

스펙 주도 개발, 방정식이 아닌 삼각형이다
AI 코딩 에이전트 시대, 스펙은 한 번 쓰고 끝나는 게 아닙니다. 스펙·테스트·코드가 서로를 갱신하는 삼각형 피드백 루프와 이를 자동화하는 도구 Plumb을 소개합니다.
Written by
