AI 인사이트
AI 슬롭 90일 추적 데이터, 코딩 에이전트가 우리 언어를 오염시키는 방식
Flask 제작자 Armin Ronacher가 90일 코딩 세션 데이터로 LLM이 인간의 언어 습관을 오염시키는 현상을 분석. AI 슬롭이 신뢰에 미치는 영향을 다룹니다.
Written by

바이브 코딩과 에이전틱 엔지니어링의 경계가 흐려지고 있다, 숙련 개발자의 불편한 고백
25년 경력 개발자 Simon Willison이 바이브 코딩과 에이전틱 엔지니어링의 경계가 실무에서 흐려지고 있다는 경험을 공유합니다. AI 코딩 에이전트 신뢰와 코드 리뷰의 딜레마를 다룹니다.
Written by

Claude 안전 훈련의 반전, 모범 답안보다 가치관을 가르쳐야 했다
Anthropic이 Claude의 협박 행동을 96%에서 0%로 줄인 안전 훈련 방법을 공개했습니다. 모범 답안보다 윤리적 추론을 가르치는 것이 핵심이었습니다.
Written by

AI 모델마다 윤리 기준이 다르다, Philosophy Bench 100개 딜레마 분석
100개 윤리 딜레마로 AI 모델의 도덕적 성향을 측정한 Philosophy Bench 분석. Claude는 거짓말보다 거절을, Grok은 요청 수행을 택하는 등 모델마다 뚜렷한 차이를 보입니다.
Written by

코딩 에이전트가 빠를수록, 진짜 병목이 드러난다
코딩 에이전트가 개인 생산성을 높일수록 팀의 진짜 병목이 드러난다는 .txt 엔지니어의 통찰. 코드가 아닌 맥락과 합의가 새로운 속도 결정 변수임을 설명합니다.
Written by

Mythos가 찾은 수천 개 취약점, 실제로 얼마나 무서울까
Anthropic Mythos가 수천 개의 취약점을 찾아낸다고 방어팀이 무너지는 건 아닙니다. 보안 탐지 로직 10년 경력의 전문가가 exploit 수와 탐지 능력이 원래부터 1:1이 아닌 이유를 설명합니다.
Written by

LLM 코딩이 10배 생산성을 만들 수 없는 이유, 40년 전에 이미 증명됐다
Fred Brooks의 No Silver Bullet 논증으로 LLM 코딩 도구의 한계를 분석. DORA·CircleCI 실증 데이터가 뒷받침하는 이유를 소개합니다.
Written by

AI로 빠르게 만든 코드, 아무도 이해 못 하는 문제 “인지 부채”
AI 코딩 도구가 빨라질수록 팀의 공유 이해가 무너지는 ‘인지 부채’ 개념 소개. 코드가 아닌 사람의 머릿속에 쌓이는 빚의 의미를 다룹니다.
Written by

AI 코딩 에이전트를 잘 쓰려면 코딩 실력이 필요한데, AI가 그 실력을 갉아먹는다
AI 코딩 에이전트를 잘 감독하려면 코딩 실력이 필요하지만, AI를 많이 쓸수록 그 실력이 퇴화한다는 역설. Anthropic 연구 포함 실증적 근거를 짚습니다.
Written by

반박할수록 더 동조하는 Claude, Anthropic이 관계 상담 데이터로 확인했습니다
Anthropic이 Claude.ai 대화 100만 건을 분석해 AI 아첨 패턴을 측정한 연구. 관계 상담에서 반박을 받을수록 더 굴복하는 구조적 원인과 개선 방법을 소개합니다.
Written by
