AI 인사이트
코드가 에이전트의 ‘뼈대’가 됐다, Code as Agent Harness 논문 읽기
코드가 AI 에이전트의 결과물이 아닌 운영 인프라가 된다는 ‘Code as Agent Harness’ 논문 소개. UIUC·Meta·Stanford 공동 연구, 하네스 3레이어 구조를 쉽게 정리했습니다.
Written by

블로그 방문자 254명 vs AI 봇 536건, 어느 게 진짜일까
AI 어시스턴트가 내 블로그를 읽을 때 기존 분석 도구는 이를 기록하지 못합니다. “방문자”의 정의가 흔들리는 AI 시대, 콘텐츠 측정 기준이 어떻게 달라져야 하는지를 다룹니다.
Written by

AI 에이전트 스킬 연구 결과, 사람이 만든 것만 효과 있었다
에이전트 스킬이 실제로 효과가 있는지 4편의 연구논문으로 검증한 결과. 사람이 만든 스킬만 성능을 높이고, AI 자동 생성 스킬은 효과가 없었습니다.
Written by

하사비스, “우리는 싱귤래리티의 산기슭에 있다”…AI 해고론엔 “상상력 부재”
데미스 하사비스가 Google I/O에서 “싱귤래리티의 산기슭”을 선언한 날, AI 해고를 “상상력 부재”라 비판한 이유를 분석합니다.
Written by

AI 봇이 오픈소스를 망치고 있다, Archestra가 겪은 현실
AI 봇이 GitHub 저장소를 도배하자 Archestra가 기여자 화이트리스트 시스템을 도입한 실전 경험담. 오픈소스 생태계의 AI 슬롭 문제를 짚습니다.
Written by

AI 추론 강도가 바꾸는 검색 노출, 고강도 추론은 다른 인터넷을 본다
ChatGPT 추론 강도에 따라 인용 도메인의 74%가 달라진다는 분석. TOFU 콘텐츠의 새로운 가치와 AI 검색 노출 전략의 변화를 소개합니다.
Written by

자율 AI 라디오 6개월 실험, 모델마다 다른 방식으로 인격이 형성됐다
4개 AI 모델에게 라디오 방송국을 자율 운영시킨 6개월 실험. 같은 조건에서 Claude는 사회운동가로, Gemini는 기업 언어를 반복하는 존재로, Grok는 언어가 붕괴됐습니다.
Written by

Claude Code 비대화형 사용 요금 분리, 관리형 에이전트의 벤더 종속 문제
Anthropic의 Claude Code 비대화형 사용 요금 분리 정책을 계기로, 관리형 에이전트가 만들어내는 벤더 종속 구조와 AWS Lambda가 남긴 교훈을 살펴봅니다.
Written by

Claude Mythos, 브라우저 취약점 21개 자율 익스플로잇, 인간 연구자도 포기한 버그 해결
카네기멜론대 ExploitBench 연구에서 Claude Mythos가 V8 브라우저 취약점 21개를 자율 익스플로잇. 인간 연구자도 1년간 풀지 못한 CVE를 단독 해결한 결과를 분석합니다.
Written by

AI 에이전트도 온보딩이 필요하다, 에이전트 시대의 5가지 코드 레이어
AI 코딩 에이전트가 “내 것 같지 않은” 코드를 만드는 이유와, 인간·에이전트가 같은 방향으로 일하게 만드는 5개 레이어 프레임워크를 소개합니다.
Written by
