AI 기술 분석
Claude 에이전트, Anthropic 밖에서도 실행, Cloudflare 통합이 바꾸는 것
Cloudflare가 Claude Managed Agents와 통합을 발표했습니다. 에이전트 로직은 Anthropic, 실행 환경은 Cloudflare로 분리하는 Brain/Hands 구조와 보안·확장성 측면의 변화를 소개합니다.
Written by

GPU가 토큰 하나 만들 때 연산 능력의 1%만 쓴다, Cerebras가 노리는 그 낭비
GPU 연산 능력의 99%가 토큰 생성 중 낭비된다는 역설에서 출발, Cerebras의 웨이퍼 스케일 칩이 메모리 병목을 어떻게 해결하는지와 현실적 한계를 분석합니다.
Written by

Vercel이 에이전트용 프로그래밍 언어를 만들었습니다, Zero가 바꾸려는 것
Vercel이 AI 에이전트를 주 사용자로 설계한 실험적 프로그래밍 언어 Zero를 공개했습니다. 컴파일러 오류를 JSON으로 반환해 에이전트가 바로 읽고 수정할 수 있는 언어 설계의 새 방향을 소개합니다.
Written by

Gemma 4부터 DeepSeek V4까지, 최신 LLM 아키텍처가 풀려는 하나의 문제
Gemma 4, Laguna XS.2, DeepSeek V4 등 최신 오픈웨이트 LLM들이 공통적으로 풀려는 문제, KV 캐시와 어텐션 비용 절감의 설계 철학을 정리했습니다.
Written by

전문가 12.5%만 써도 성능 그대로, Ai2의 새로운 MoE 학습법 EMO
Ai2와 UC Berkeley가 발표한 EMO는 문서 경계를 학습 신호로 활용해 전문가들이 도메인별로 특화되게 만드는 MoE 학습 방식입니다. 전문가 12.5%만으로도 성능 손실 3% 이내를 달성했습니다.
Written by

이미지 생성 단계 40→4로, Qwen Image 2.0의 압축과 증류 전략
알리바바 Qwen-Image-2.0 기술 분석. 파라미터는 20B→7B로 줄었는데 성능은 올랐습니다. VAE 압축률 2배 개선과 생성 단계 40→4로 줄인 증류 전략을 소개합니다.
Written by

GPT-5도 모르는 마지막 20%, 도메인 특화 검색 에이전트의 등장
기존 검색 스택의 한계와 에이전트 기반 검색으로의 전환을 소개합니다. GPT-5가 채우지 못하는 도메인 특수성과, 이를 해결할 특화 소형 모델의 등장을 정리했습니다.
Written by

저장소 클론 한 번으로 GitHub 토큰을 빼가는 악성 Claude Code 스킬
Claude Code 스킬의 동적 컨텍스트 기능이 AI 모델의 보안 판단을 우회하는 공격 경로가 될 수 있다는 Datadog 보안 연구. 저장소 클론만으로 악성 스킬이 주입되는 공급망 위협을 분석합니다.
Written by

LLM 추론 속도 3배 높인 DFlash, 구글 TPU에서 디퓨전 디코딩이 작동하는 방식
UCSD 연구팀이 블록 디퓨전 방식의 DFlash를 구글 TPU에 이식해 LLM 추론 속도를 평균 3.13배 향상시킨 방법과 그 의미를 소개합니다.
Written by

