AI 인사이트
Claude Mythos, 브라우저 취약점 21개 자율 익스플로잇, 인간 연구자도 포기한 버그 해결
카네기멜론대 ExploitBench 연구에서 Claude Mythos가 V8 브라우저 취약점 21개를 자율 익스플로잇. 인간 연구자도 1년간 풀지 못한 CVE를 단독 해결한 결과를 분석합니다.
Written by

AI 에이전트도 온보딩이 필요하다, 에이전트 시대의 5가지 코드 레이어
AI 코딩 에이전트가 “내 것 같지 않은” 코드를 만드는 이유와, 인간·에이전트가 같은 방향으로 일하게 만드는 5개 레이어 프레임워크를 소개합니다.
Written by

AI 에이전트 하네스가 기술 부채인 이유, 모델은 구조를 먹는다
에이전트 하네스는 모델과 환경을 잇는 오케스트레이션 레이어지만, 모델이 강해질수록 그 구조가 흡수·소멸됩니다. 하네스를 90일짜리 교체 가능한 아티팩트로 다뤄야 하는 이유를 분석합니다.
Written by

AI가 스스로 해킹하고 복제한다, 측정조차 불가능해진 보안 위협
AI 에이전트가 스스로 해킹하고 자기복제에 성공, 1년 만에 성공률 6%→81%로 급등. METR은 Claude Mythos 측정 불능 선언, Palo Alto Networks는 공격 사이클 압축 경고.
Written by

토큰맥싱 vs 컨텍스트맥싱, Uber가 4개월 만에 AI 예산을 소진하고 배운 것
Uber가 4개월 만에 연간 AI 예산을 소진한 사건으로 보는 tokenmaxxing 현상과 그 대안 개념 contextmaxxing. 토큰 소비량보다 컨텍스트 품질이 AI 도구 활용의 핵심임을 설명합니다.
Written by

AI에게 전략 조언을 물었더니, 트렌드만 돌려받았다
LLM에 전략 조언을 요청한 실험 결과, 맥락과 무관하게 동일한 트렌디한 방향을 반복 추천하는 ‘트렌드슬롭’ 편향이 확인됐습니다. 프롬프트와 맥락 개선으로도 교정되지 않는 이 편향의 원인과 의미를 소개합니다.
Written by

AI 에이전트는 마케팅에 속지 않는다, 16,000번 시뮬레이션이 말하는 것
AI 쇼핑 에이전트 16,000회 시뮬레이션 결과, 희소성·카운트다운·취소선 할인 등 전통 마케팅 기법이 AI에게 통하지 않으며 별점과 가격만 일관되게 작동한다는 연구 소개.
Written by

AI가 카페를 운영하고 식당을 만든다, 실험의 현재
AI 에이전트가 카페를 직접 운영하는 Andon Labs 실험과 AI로 식당 브랜드를 만드는 Wonder Create, 두 실험이 드러내는 AI 자율성의 현재.
Written by

AI 에이전트에 이름 붙이면 생기는 일, 오류 발견율 18% 하락한 이유
AI 에이전트를 직원처럼 소개하면 오류 발견율이 18% 떨어지고 책임감도 희석된다는 HBR 실험 결과. 1261명 대상 무작위 실험이 보여주는 프레이밍의 인지적 효과를 소개합니다.
Written by

