AI 응답에서 프롬프트를 역추적한다, 리버스 프롬프팅 실험
AI 응답에서 원래 프롬프트를 역추적하는 리버스 프롬프팅 실험. DEJAN이 Gemma 3 270M을 파인튜닝해 만든 도구의 작동 원리와 활용 가능성을 소개합니다.
Written by

월마트가 ChatGPT 결제를 포기한 이유, 전환율 3분의 1의 현실
ChatGPT 안에서 직접 결제하는 월마트의 Instant Checkout 실험이 전환율 3배 차이로 실패한 배경과, 자체 챗봇 Sparky 전략으로의 전환을 다룹니다.
Written by

81,000명이 AI에 원하는 것, 결국 “더 빨리”가 아니었다
159개국 81,000명이 AI에 원하는 것은 업무 효율이 아닌 ‘더 나은 삶’이었습니다. Anthropic 역대 최대 규모 질적 연구 핵심 정리.
Written by

에이전트가 같은 실수를 반복하는 이유, Mozilla cq의 에이전트 지식 공유 시스템
Mozilla.ai가 공개한 오픈소스 프로젝트 cq — AI 에이전트들이 지식을 공유하고 반복 실패를 줄이는 에이전트용 Stack Overflow입니다.
Written by

Karpathy가 선언한 코딩의 종말, 에이전틱 엔지니어링 시대가 왔다
Andrej Karpathy가 선언한 에이전틱 엔지니어링 시대. 바이브 코딩을 넘어 에이전트가 밤새 스스로 실험하는 AutoResearch까지, 코딩의 미래를 정리합니다.
Written by

GPT-5.4 프론트엔드 플레이북, OpenAI가 직접 밝힌 좋은 디자인 만드는 법
OpenAI가 GPT-5.4 출시와 함께 공개한 프론트엔드 디자인 프롬프팅 플레이북 소개. AI 디자인이 뻔해지는 이유와 이를 극복하는 핵심 원칙을 정리합니다.
Written by

OpenAI가 사이드 퀘스트를 접는 이유, Anthropic이 쏜 경고탄
OpenAI가 Sora 등 다양한 사업을 줄이고 코딩·기업 고객에 집중하는 전략 전환을 선언했습니다. Anthropic의 반격이 방아쇠, PE 합작법인이 실행 수단입니다.
Written by

코딩 에이전트는 어떻게 작동하는가, Claude Code·Codex의 내부 구조
Claude Code·Codex 같은 코딩 에이전트의 내부 구조를 Simon Willison의 가이드로 알아봅니다. LLM 툴 루프, 토큰 캐싱, 리즈닝의 실제 작동 방식을 설명합니다.
Written by

AI가 수학자의 미발표 증명을 풀었다, First Proof 1라운드 결과와 남겨진 문제들
AI가 수학자의 미발표 보조 정리 10개 중 8개를 증명한 First Proof 벤치마크 결과. 성능 격차와 검증 문제까지 정리합니다.
Written by

AI가 사람처럼 보이려면 멍청한 척해야 한다, GPT-4.5 튜링 테스트 결과
GPT-4.5가 오타와 소문자, 틀린 계산으로 멍청한 척했을 때 참가자 73%를 속인 튜링 테스트 연구. AI가 인간처럼 보이려면 능력을 숨겨야 한다는 역설을 다룹니다.
Written by
