LLM 추론 속도 3배 높인 DFlash, 구글 TPU에서 디퓨전 디코딩이 작동하는 방식
UCSD 연구팀이 블록 디퓨전 방식의 DFlash를 구글 TPU에 이식해 LLM 추론 속도를 평균 3.13배 향상시킨 방법과 그 의미를 소개합니다.
Written by
AI 에이전트는 마케팅에 속지 않는다, 16,000번 시뮬레이션이 말하는 것
AI 쇼핑 에이전트 16,000회 시뮬레이션 결과, 희소성·카운트다운·취소선 할인 등 전통 마케팅 기법이 AI에게 통하지 않으며 별점과 가격만 일관되게 작동한다는 연구 소개.
Written by
로컬 모델은 왜 5분 만에 포기하게 될까, 개발자가 진단한 구조적 문제
로컬 AI 모델이 호스팅 경험에 못 미치는 이유를 Flask 창시자 Armin Ronacher가 진단합니다. 파편화, 완성도 부재, 임계 질량 부족이 핵심이며, ds4.c로 해법을 실험 중입니다.
Written by
AI 모델이 가전제품이 되고 있다, 하네스 오버피팅 트렌드
AI 랩들이 자사 인터페이스 동작 방식을 모델에 직접 학습시키며, 프론티어 모델이 범용 플랫폼이 아닌 가전제품처럼 닫혀가는 트렌드를 분석합니다.
Written by
AI가 만든 해킹 코드, 처음으로 실제 공격에 쓰였다
Google Threat Intelligence Group이 AI로 개발된 제로데이 취약점이 실제 공격에 처음 사용된 사례를 공개했습니다. AI가 해커의 취약점 발굴 방식을 어떻게 바꾸는지 분석합니다.
Written by
AI가 카페를 운영하고 식당을 만든다, 실험의 현재
AI 에이전트가 카페를 직접 운영하는 Andon Labs 실험과 AI로 식당 브랜드를 만드는 Wonder Create, 두 실험이 드러내는 AI 자율성의 현재.
Written by
AI 에이전트에 이름 붙이면 생기는 일, 오류 발견율 18% 하락한 이유
AI 에이전트를 직원처럼 소개하면 오류 발견율이 18% 떨어지고 책임감도 희석된다는 HBR 실험 결과. 1261명 대상 무작위 실험이 보여주는 프레이밍의 인지적 효과를 소개합니다.
Written by
GPT-5.5 실제 비용 분석, 짧은 프롬프트는 오히려 92% 더 비싸졌다
GPT-5.5의 실제 비용을 OpenRouter 실사용 데이터로 분석. 짧은 프롬프트 사용자는 최대 92% 비용 증가, OpenAI의 “짧은 응답 상쇄” 주장과의 간극을 공개합니다.
Written by
Claude Code 팀이 Markdown 대신 HTML을 쓰는 이유
Claude Code 팀이 AI 출력 포맷을 Markdown에서 HTML로 전환하는 이유. 가독성·공유·인터랙티비티 측면에서 HTML이 더 나은 이유를 소개합니다.
Written by
AlphaEvolve 1년 성과, AI가 수학 난제부터 TPU 회로까지 설계한 방법
Google DeepMind AlphaEvolve 출시 1년 성과 정리. 수학 난제 해결부터 TPU 회로 설계, 물류 최적화까지 알고리즘 진화 AI가 만들어낸 실질적 결과를 소개합니다.
Written by









