Archive
OpenAI가 사이드 퀘스트를 접는 이유, Anthropic이 쏜 경고탄
OpenAI가 Sora 등 다양한 사업을 줄이고 코딩·기업 고객에 집중하는 전략 전환을 선언했습니다. Anthropic의 반격이 방아쇠, PE 합작법인이 실행 수단입니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI가 수학자의 미발표 증명을 풀었다, First Proof 1라운드 결과와 남겨진 문제들
AI가 수학자의 미발표 보조 정리 10개 중 8개를 증명한 First Proof 벤치마크 결과. 성능 격차와 검증 문제까지 정리합니다.
Written by

AI가 사람처럼 보이려면 멍청한 척해야 한다, GPT-4.5 튜링 테스트 결과
GPT-4.5가 오타와 소문자, 틀린 계산으로 멍청한 척했을 때 참가자 73%를 속인 튜링 테스트 연구. AI가 인간처럼 보이려면 능력을 숨겨야 한다는 역설을 다룹니다.
Written by

AI로 콘텐츠 500개 만들었더니, 구글이 사이트 전체를 날렸다
AI로 콘텐츠를 대량 생산하는 전략이 왜 반복해서 실패하는지 역사적 흐름으로 분석. 2025년 Google의 실제 수동 조치 사례와 LLM 검색 시대의 추가 리스크를 다룹니다.
Written by

OpenAI의 Astral 인수, AI 코딩 전쟁이 Python 인프라로 번지다
OpenAI가 Python 도구 uv·Ruff·ty를 만든 Astral을 인수했습니다. Anthropic의 Bun 인수와 맞닿은 AI 코딩 플랫폼 경쟁의 새 국면을 분석합니다.
Written by

MiniMax M2.7, 자기 진화 100회 반복으로 성능 30% 높인 방법
MiniMax M2.7이 100회 이상의 자율 최적화 루프로 자신의 강화학습 파이프라인을 개선해 성능 30%를 높인 방법. GLM-5 동급 성능을 1/3 비용으로 달성한 과정도 소개합니다.
Written by

AI 에이전트 성능을 좌우하는 하네스 설계, LangChain이 정리한 핵심 구조
에이전트 성능을 결정하는 건 모델만이 아닙니다. LangChain이 ‘하네스’의 개념과 파일시스템·샌드박스·컨텍스트 관리 등 핵심 구성요소를 체계적으로 정리했습니다.
Written by

Claude Code, 이제 자리 비워도 텔레그램으로 지시한다
Claude Code에 추가된 Channels 기능 소개. 텔레그램·디스코드로 실행 중인 세션에 메시지를 보내고 응답받는 양방향 AI 에이전트 구조를 설명합니다.
Written by

에이전트가 고객인 제품을 만들어봤습니다, Agentstorage 개발자의 발견
AI 에이전트 전용 파일 호스팅 서비스 Agentstorage를 만들며 발견한 인사이트. 인간용 UX와 에이전트용 UX가 얼마나 다른지, 에이전트 친화적 제품 설계의 핵심 조건을 소개합니다.
Written by
