컨텍스트 윈도우는 200만 토큰까지 커졌는데, AI는 왜 방금 준 정보를 못 쓸까
컨텍스트 윈도우가 200만 토큰까지 커져도 AI가 중간 정보를 놓치는 U-shape 현상과, 양보다 정밀도가 중요한 이유. 개인 실무자가 바로 쓸 수 있는 5가지 컨텍스트 관리 원칙을 정리했습니다.
Written by
GLM-5.2가 바꾼 것, 이제 오픈 모델은 싸기만 한 게 아니다
Z.ai의 GLM-5.2가 코딩 하네스에서 제대로 작동하는 첫 오픈웨이트 모델로 평가받습니다. 프론티어 대비 6분의 1 비용, 6.8개월로 좁혀진 성능 격차가 실무자의 모델 선택에 갖는 의미를 짚습니다.
Written by
직접 만든 에이전트 코드, 이제는 짐이 됩니다, 하네스 시대의 개발 전략
AI 에이전트의 ‘하네스’ 개념과 직접 구현 시대의 종말. 코딩 에이전트를 만든 개발자가 벤치마크로 검증한, 모델 회사 하네스 위에서 진짜 차별점에 집중하는 전략을 소개합니다.
Written by
가격이 100배 싸졌다는데, 왜 내 AI 청구서는 오를까
OpenAI 임원은 지능 가격이 100배 내렸다고 말하지만 최상위 모델은 더 비싸졌습니다. test-time compute로 풀어보는 AI 가격의 역설과 개인 실무자가 주목할 관점.
Written by
OpenAI가 만든 첫 AI 칩 할라피뇨, AI가 9개월 만에 설계를 끝냈다
OpenAI가 브로드컴과 첫 자체 추론 칩 할라피뇨를 공개했습니다. AI 모델이 직접 설계를 도와 9개월 만에 완성한 이 칩이 추론 비용과 AI 경제성에 갖는 의미를 살펴봅니다.
Written by
멋진 에이전트 아키텍처가 답하지 못하는 질문, “이건 누가 책임지죠?”
멋진 에이전트 아키텍처가 정작 “누가 책임지는가”에 답하지 못하는 principal drift 현상. 환불 에이전트 사례로 신원·권한·책임이 무너지는 과정과 개인이 직접 해볼 수 있는 진단법을 소개합니다.
Written by
잘 만든 AI 프로토타입이 제품이 되지 못하는 이유, ‘프롬프트 부채’
자연어 프롬프트로 만든 AI 프로토타입이 왜 제품으로 자라지 못하는가. Drew Breunig이 짚은 ‘프롬프트 부채’ 개념과, 측정 기반 명세·프롬프트 자동 탐색이라는 대안을 소개합니다.
Written by
매번 처음부터 설명하던 AI 챗봇이, 회사를 기억하는 동료가 되다
Anthropic이 Slack에서 @Claude를 태그해 작업을 위임하는 Claude Tag를 공개했습니다. 채널 맥락을 학습하는 AI 팀원이 무엇을 바꾸는지 살펴봅니다.
Written by
GPT-5.5 Instant 업데이트, 이제 질문의 ‘글자’가 아니라 ‘의도’를 읽는다
OpenAI가 ChatGPT의 GPT-5.5 Instant를 업데이트해 질문의 의도 파악, 멀티턴 맥락 유지, 반박 대응을 개선했습니다. 모델 경쟁의 축이 정답률에서 대화 품질로 옮겨가는 신호를 짚어봅니다.
Written by
구글 AI 매출 800% 성장, 진짜 신호는 4600억 달러 백로그에 있다
알파벳 1분기 실적 발표에서 구글의 생성형 AI 제품 매출이 800% 성장했습니다. 4600억 달러 백로그와 사용량 지표가 보여주는, 엔터프라이즈 AI가 실험에서 인프라로 넘어가는 신호를 짚어봅니다.
Written by









