AI 기술 분석
실패도 자산이다, Google ReasoningBank가 AI 에이전트 기억을 바꾸는 방식
Google Research가 발표한 ReasoningBank는 AI 에이전트가 성공과 실패 경험 모두에서 고수준 추론 패턴을 학습하는 메모리 프레임워크입니다. 에이전트가 경험을 통해 스스로 성장하는 새로운 스케일링 방향을 제시합니다.
Written by

OpenAI Privacy Filter, PII를 문맥으로 구분하는 1.5B 오픈 모델 공개
OpenAI가 공개한 PII 탐지·마스킹 오픈 모델 Privacy Filter. 문맥 기반으로 공개·사적 정보를 구분하며, 로컬 실행과 파인튜닝을 지원합니다.
Written by

Gemma 4가 증명한 것, AI 모델은 이제 하나의 설계로 모든 곳을 커버할 수 없다
Google Gemma 4가 엣지와 서버를 아예 다른 아키텍처로 설계한 이유. 하드웨어 제약이 AI 모델 설계를 어떻게 바꾸고 있는지 분석합니다.
Written by

Claude Code 소스코드를 뜯어봤더니, 아키텍처에서 발견한 5가지 설계 원칙
Claude Code TypeScript 소스코드를 직접 분석한 논문에서 드러난 5가지 설계 원칙. Anthropic이 공개하지 않은 에이전트 내부 구조를 해부합니다.
Written by

DeepSeek V4 출시, 1M 컨텍스트를 에이전트가 실제로 쓸 수 있게 만든 방법
DeepSeek V4가 1M 토큰 컨텍스트를 실용적으로 만든 방법. CSA·HCA 하이브리드 어텐션으로 KV 캐시를 90% 줄이고 에이전트 추론 흐름을 개선했습니다.
Written by

LLM 모델 크기 22% 줄인 Cloudflare, 품질은 그대로인 무손실 압축 원리
Cloudflare가 LLM 모델 크기를 22% 줄이면서 출력 품질은 그대로 유지하는 무손실 압축 시스템 Unweight를 개발했습니다. 핵심 원리와 결과를 소개합니다.
Written by

Claude Code 품질 저하의 진짜 원인, Anthropic의 공식 분석
Claude Code 품질 저하를 일으킨 3가지 원인에 대한 Anthropic의 공식 분석. 추론 노력 변경, 캐싱 버그, 시스템 프롬프트가 맞물린 과정을 소개합니다.
Written by

Claude는 왜 yes/no를 거부할까, 4.7 시스템 프롬프트 변경 분석
Claude Opus 4.7 시스템 프롬프트 변경사항 분석. yes/no 거절 설계, 덜 간섭적인 행동 지침, 아동 안전 강화 등 Anthropic의 AI 설계 철학 변화를 살펴봅니다.
Written by

사진 한 장이 45분을 말한다, LPM 1.0이 만드는 AI 대화 캐릭터
사진 한 장으로 45분 실시간 대화 영상을 만드는 LPM 1.0 연구 소개. 말하기·듣기·침묵을 각각 처리하는 구조와 딥페이크 위험 사이의 긴장감을 짚습니다.
Written by

Claude Code vs Pi, 같은 작업에서 토큰 사용이 10배 차이 나는 이유
Claude Code와 Pi를 같은 작업으로 비교했더니 토큰 소비가 10배 차이. 에이전트가 자기 자신에게 쓰는 하네스 세금 개념을 설명합니다.
Written by
