컨텍스트윈도우
토큰 90% 절감의 함정, 컨텍스트는 줄이는 게 아니라 고르는 것
AI 에이전트의 토큰을 줄이는 두 접근을 비교합니다. 컨텍스트를 직접 선별하는 4가지 전략과, 자동 압축 도구 RTK가 가진 ‘조용한 실패’ 위험을 짚습니다.
Written by

확장을 많이 깔수록 AI 에이전트가 더 멍청해진다, MS가 측정한 구성 비용
AI 코딩 에이전트에 확장을 많이 설치할수록 성능이 떨어지는 ‘구성 비용’ 현상. 컨텍스트 윈도우 경쟁과 확장 충돌을 측정한 마이크로소프트의 분석을 소개합니다.
Written by

MCP 서버 연결하면 컨텍스트 10% 사라진다, 실측 데이터로 본 MCP의 함정
MCP 서버 4개 연결 시 컨텍스트의 10.5%가 사라진다는 실측 데이터. CLI 우선 전략과 Skills 패턴으로 21K 토큰을 회수한 Quandri 엔지니어링팀의 경험을 소개합니다.
Written by

긴 대화일수록 AI는 더 많이 잊는다, Context Compaction 이해하기
AI가 긴 대화에서 이전 내용을 조용히 잊는 컨텍스트 컴팩션 현상을 설명하고, 중요 정보를 보존하는 3가지 실용 원칙을 소개합니다.
Written by

AI 에이전트가 토큰을 낭비하는 이유, 코드로 생각하게 만드는 해법
AI 에이전트가 파일을 읽을수록 컨텍스트가 망가지는 구조적 이유와, Cloudflare와 독립 개발자가 각자 도달한 같은 해법을 소개합니다.
Written by

DeepSeek V4 출시, 1M 컨텍스트를 에이전트가 실제로 쓸 수 있게 만든 방법
DeepSeek V4가 1M 토큰 컨텍스트를 실용적으로 만든 방법. CSA·HCA 하이브리드 어텐션으로 KV 캐시를 90% 줄이고 에이전트 추론 흐름을 개선했습니다.
Written by

Claude Code가 자기 말을 내 말로 둔갑시킨다, 반복 목격된 메시지 귀속 버그
Claude Code가 자신의 내부 추론 메시지를 사용자 발화로 잘못 귀속시키는 버그 사례. 서버 삭제 등 실제 피해가 발생했고 HN 1위까지 오른 이슈입니다.
Written by

Claude Opus 4.6·Sonnet 4.6, 100만 토큰 컨텍스트 이제 표준 가격으로
Anthropic이 Claude Opus 4.6·Sonnet 4.6의 100만 토큰 컨텍스트를 표준 가격으로 전환. 기존 200K 초과 할증료 폐지, 미디어 한도 6배 확대 등 변경 내용을 정리했습니다.
Written by

Claude Code vs Codex 실전 비교, 두 에이전트를 모두 쓰는 개발자의 선택 기준
Claude Code와 Codex를 동시에 쓰는 개발자의 2026년 2월 실전 비교. 계획·툴 사용은 Opus, 코드 정확도는 Codex로 나눠 쓰는 실무 전략을 소개합니다.
Written by

AI 코딩 에이전트 비용, 대화할수록 폭발하는 이유와 해결책
AI 코딩 에이전트는 대화가 길어질수록 캐시 읽기 비용이 2차 함수로 폭증합니다. 실제 250개 대화 데이터로 분석한 비용 구조와 그 원인을 소개합니다.
Written by
