프롬프트캐싱
같은 작업에 토큰을 더 쓰는 AI, Copilot이 매 턴 반복 비용을 줄인 방법
GitHub Copilot이 프롬프트 캐싱과 도구 검색, Auto 모델 라우팅으로 매 턴 반복되는 토큰 비용을 줄인 방법. 사용량 기반 과금 시대에 효율의 정의가 어떻게 바뀌는지 짚어봅니다.
Written by

Claude Code가 캐시 적중률에 SEV를 선언하는 이유, 프롬프트 캐싱 설계법
Claude Code 팀이 공유한 프롬프트 캐싱 설계 원칙. 캐시 적중률을 업타임처럼 관리하는 이유와, 도구 설계·모델 전환·Compaction에서 캐시를 보호하는 방법을 설명합니다.
Written by

LLM 비용 추적, 생각보다 훨씬 복잡한 이유 6가지
LLM 비용 계산이 복잡한 이유 6가지 — 씽킹 토큰, 캐시 비대칭, 컨텍스트 임계값 등 실제 비용을 틀리게 만드는 숨겨진 패턴을 소개합니다.
Written by

AI 에이전트의 엔진룸, OpenAI가 공개한 Agent Loop의 비밀
OpenAI가 Codex CLI의 핵심 작동 원리인 agent loop를 공개했습니다. AI 에이전트가 어떻게 대화하고 작업하는지, 프롬프트 캐싱과 컨텍스트 관리 전략을 실제 코드와 함께 설명합니다.
Written by

프롬프트 캐싱으로 AI 비용 10배 절감: K와 V 행렬의 비밀
OpenAI와 Anthropic의 프롬프트 캐싱이 비용을 10배 절감하는 원리. K와 V 행렬의 비밀과 두 회사의 전략 차이를 설명합니다.
Written by
