AI의 ‘추론’을 감사할 수 있을까, Claude Code thinking 로그의 진실
Claude Code의 thinking 로그를 열어보니 암호화된 서명만 남아 있었다는 개발자의 발견. AI 추론을 기록·감사하려 할 때 마주치는 봉인의 구조를 공식 문서와 함께 짚습니다.
Written by
Reddit 댓글 13단어로 AI 검색 답변을 바꾼다, 코넬 연구가 밝힌 취약점
Reddit 댓글에 13단어만 붙이면 ChatGPT·구글 AI 검색 답변을 조작할 수 있다는 코넬 테크 연구. AI 검색의 구조적 취약점 WARP 공격을 소개합니다.
Written by
AI에게 “아키텍처 좀 지켜줘”를 백 번 말해도 안 되는 이유
AI 코딩 도구가 만드는 ‘drift’ 문제와, 프롬프트 강화 대신 코드베이스에 가드레일을 세우는 한 개발자의 실전 시스템을 소개합니다. 350세션의 실측 데이터 포함.
Written by
작은 AI 모델이 큰 모델을 따라잡는 방법, Skill 16.6%p의 비밀
잘 만든 Agent Skill은 AI 에이전트 정답률을 16.6%p 높이지만 모든 Skill이 도움되는 건 아닙니다. 87개 과제로 측정한 SkillsBench 연구와 좋은 Skill의 조건을 소개합니다.
Written by
헤드폰을 한 번도 안 물었는데, ChatGPT는 어떻게 헤드폰 광고를 띄울까
ChatGPT 광고는 키워드가 아닌 대화 맥락으로 작동합니다. 사용자의 46%가 구매 의도 없이 시작했다는 Similarweb 분석으로 본 ‘AI 광고’의 새로운 작동 원리.
Written by
깔끔했던 Transformer가 복잡해진 이유, 그리고 에이전트의 한계
깔끔했던 Transformer가 어텐션 변종과 MoE로 복잡해진 이유, 그리고 AI 에이전트가 이 복잡성을 자동으로 풀 수 없는 까닭을 메타 출신 엔지니어 Ian Barber의 글로 풀어봅니다.
Written by
Claude Design, 디자인을 코드로 넘길 때 다시 그리던 시대를 끝내다
Claude Design 베타 업데이트가 디자인 시스템 자동 준수와 Claude Code 양방향 연동을 도입했습니다. AI 디자인 도구의 핸드오프 단절 문제를 어떻게 건드리는지 살펴봅니다.
Written by
AI 지능 곡선이 평평해진다, 격차는 모델이 아니라 사람에서 갈린다
지금까지는 새 모델이 나올 때마다 더 똑똑해졌고, 우리는 그 차이를 분명히 느꼈습니다. 그런데 어떤 사람들은 이제 Opus 4.8과 Fable 5의 차이를 잘 모르겠다고 말합니다. 발전이 멈춰서가 아닙니다. 곡선이 평평해 보이는 데는 전혀 다른 이유가 있습니다. 30년 넘게 업계에 몸담은 개발자 Steve Yegge가 “The Flat Curve Society”라는 글을 발표했습니다. 핵심 주장은 이렇습니다. AI의 능력은 앞으로도 기하급수적으로…
Written by
LLM은 태그가 아니라 말투로 권한을 판단한다, 공격 성공률 61%를 만든 ‘역할 혼동’
LLM이 역할 태그가 아니라 글의 말투로 권한을 판단한다는 ICML 2026 연구. 가짜 추론을 심는 CoT Forgery로 공격 성공률이 61%까지 오르는 ‘역할 혼동’ 현상을 소개합니다.
Written by
프롬프트는 문제가 없었다, MS가 찾은 LLM 신뢰성의 진짜 해법
LLM 출력이 형식은 완벽한데 내용이 비는 문제를, MS가 결정론적 추출과 AI 추론을 분리해 해결한 사례. 프롬프트가 아닌 책임 경계가 답이었습니다.
Written by









