Claude Mythos, 브라우저 취약점 21개 자율 익스플로잇, 인간 연구자도 포기한 버그 해결
카네기멜론대 ExploitBench 연구에서 Claude Mythos가 V8 브라우저 취약점 21개를 자율 익스플로잇. 인간 연구자도 1년간 풀지 못한 CVE를 단독 해결한 결과를 분석합니다.
Written by
AI 코딩 도구, 학습 효과 살리는 사용법이 따로 있다
AI 코딩 도구가 학습을 방해한다는 3가지 연구와, 실력을 유지하며 AI를 쓰는 태도를 소개합니다. Addy Osmani 원문 큐레이션.
Written by
ChatGPT에 금융 계좌 연결 가능해진다, OpenAI의 개인화 전략 본격화
OpenAI가 ChatGPT에 은행 계좌 연동 기능을 출시했습니다. Plaid를 통해 실제 거래 데이터를 분석하는 개인 맞춤형 금융 AI, 작동 방식과 프라이버시 설계를 소개합니다.
Written by
Gemma 4부터 DeepSeek V4까지, 최신 LLM 아키텍처가 풀려는 하나의 문제
Gemma 4, Laguna XS.2, DeepSeek V4 등 최신 오픈웨이트 LLM들이 공통적으로 풀려는 문제, KV 캐시와 어텐션 비용 절감의 설계 철학을 정리했습니다.
Written by
ChatGPT와 Codex가 하나로, OpenAI가 에이전트 올인 선언한 이유
OpenAI가 ChatGPT·Codex·API를 하나의 에이전틱 플랫폼으로 통합합니다. Anthropic·Google의 압박과 IPO를 앞두고 핵심에 집중하는 전략 전환의 배경을 정리했습니다.
Written by
AI가 AI를 만드는 시대, 재귀적 자기개선은 어디까지 왔나
AI가 스스로를 개선하는 재귀적 자기개선(RSI)이 실제로 어디까지 왔는지, OpenAI·Anthropic·DeepMind 최신 사례와 한계, 미래 전망을 소개합니다.
Written by
구글이 직접 말하는 AI 검색 최적화, llms.txt와 AEO는 필요 없다
구글이 공식 발표한 AI 검색 최적화 가이드. llms.txt, AEO, 콘텐츠 청킹 등 인터넷에 떠도는 GEO 기법들이 실제로는 불필요하다는 점을 정리합니다.
Written by
전문가 12.5%만 써도 성능 그대로, Ai2의 새로운 MoE 학습법 EMO
Ai2와 UC Berkeley가 발표한 EMO는 문서 경계를 학습 신호로 활용해 전문가들이 도메인별로 특화되게 만드는 MoE 학습 방식입니다. 전문가 12.5%만으로도 성능 손실 3% 이내를 달성했습니다.
Written by
할루시네이션 인용 논문 올리면 1년 퇴출, arXiv의 AI 슬롭 대응책
arXiv가 AI 생성 할루시네이션이 포함된 논문 제출자에게 1년 제출 금지 페널티를 부과합니다. 학술 생태계가 AI 슬롭에 대응하는 방식을 소개합니다.
Written by
모델보다 하네스가 중요하다, Claude Code 대규모 운영의 핵심 원리
Anthropic이 공개한 Claude Code 대규모 운영 핵심 원리. 모델보다 하네스(CLAUDE.md·Hooks·Skills·Plugins·LSP·MCP)가 성능을 좌우한다는 통찰을 소개합니다.
Written by









