AI 모델이 가전제품이 되고 있다, 하네스 오버피팅 트렌드
AI 랩들이 자사 인터페이스 동작 방식을 모델에 직접 학습시키며, 프론티어 모델이 범용 플랫폼이 아닌 가전제품처럼 닫혀가는 트렌드를 분석합니다.
Written by
AI가 만든 해킹 코드, 처음으로 실제 공격에 쓰였다
Google Threat Intelligence Group이 AI로 개발된 제로데이 취약점이 실제 공격에 처음 사용된 사례를 공개했습니다. AI가 해커의 취약점 발굴 방식을 어떻게 바꾸는지 분석합니다.
Written by
AI가 카페를 운영하고 식당을 만든다, 실험의 현재
AI 에이전트가 카페를 직접 운영하는 Andon Labs 실험과 AI로 식당 브랜드를 만드는 Wonder Create, 두 실험이 드러내는 AI 자율성의 현재.
Written by
AI 에이전트에 이름 붙이면 생기는 일, 오류 발견율 18% 하락한 이유
AI 에이전트를 직원처럼 소개하면 오류 발견율이 18% 떨어지고 책임감도 희석된다는 HBR 실험 결과. 1261명 대상 무작위 실험이 보여주는 프레이밍의 인지적 효과를 소개합니다.
Written by
GPT-5.5 실제 비용 분석, 짧은 프롬프트는 오히려 92% 더 비싸졌다
GPT-5.5의 실제 비용을 OpenRouter 실사용 데이터로 분석. 짧은 프롬프트 사용자는 최대 92% 비용 증가, OpenAI의 “짧은 응답 상쇄” 주장과의 간극을 공개합니다.
Written by
Claude Code 팀이 Markdown 대신 HTML을 쓰는 이유
Claude Code 팀이 AI 출력 포맷을 Markdown에서 HTML로 전환하는 이유. 가독성·공유·인터랙티비티 측면에서 HTML이 더 나은 이유를 소개합니다.
Written by
AlphaEvolve 1년 성과, AI가 수학 난제부터 TPU 회로까지 설계한 방법
Google DeepMind AlphaEvolve 출시 1년 성과 정리. 수학 난제 해결부터 TPU 회로 설계, 물류 최적화까지 알고리즘 진화 AI가 만들어낸 실질적 결과를 소개합니다.
Written by
비전 에이전트 vs API 에이전트, 같은 작업에 45배 비용 차이 나는 이유
비전 에이전트와 API 에이전트로 같은 작업을 했을 때 45배 비용 차이가 나는 이유를 Reflex 벤치마크 결과로 살펴봅니다.
Written by
AI 슬롭 90일 추적 데이터, 코딩 에이전트가 우리 언어를 오염시키는 방식
Flask 제작자 Armin Ronacher가 90일 코딩 세션 데이터로 LLM이 인간의 언어 습관을 오염시키는 현상을 분석. AI 슬롭이 신뢰에 미치는 영향을 다룹니다.
Written by









