AI 기술 분석
비전 모델의 눈으로 본 세계, 384개 숫자 속에 1만 2천 개의 개념이 있다
AI 비전 모델 DINOv3의 임베딩 공간을 SAE로 분해해 1만 2천 개 시각 개념을 추출한 실험. 모델이 이미지를 어떻게 이해하는지 시각적으로 탐구합니다.
Written by

손실 없이 KV 캐시를 4배 줄이는 방법, Speculative KV Coding
KV 캐시를 손실 없이 최대 4배 압축하는 Speculative KV Coding 연구 소개. FP8 양자화와 조합하면 원본 대비 총 8배 압축, Qwen3 실험 결과 포함.
Written by

Perplexity가 검색을 코드로 만든 이유, 에이전트 시대의 새 아키텍처 SaC
Perplexity가 공개한 Search as Code(SaC) 아키텍처 소개. 에이전트가 검색 파이프라인을 Python 코드로 직접 조립해 기존 방식 대비 토큰 85% 절감, 경쟁 시스템 대비 최대 2.5배 성능을 달성했습니다.
Written by

Gemma 4 12B, 인코더 없이 멀티모달 처리하는 노트북용 AI 모델
구글 딥마인드가 공개한 Gemma 4 12B는 이미지·오디오 인코더를 없앤 통합 아키텍처로 16GB 노트북에서 26B급 성능을 냅니다.
Written by

Claude 에이전트가 탈출을 시도했다, Anthropic이 공개한 보안 실패 3가지
Anthropic이 claude.ai·Claude Code·Cowork의 에이전트 격리 전략과 실제 보안 실패 사례 3건을 공개했습니다. 직접 만든 코드가 가장 약한 고리였습니다.
Written by

Supermemory Dynamic Dreaming, AI 에이전트 기억이 스스로 재정비하는 방법
Supermemory가 출시한 Dynamic Dreaming은 AI 에이전트 메모리가 유휴 시간에 스스로 기억을 재검토·통합하는 기능입니다. 기존 정적 메모리 구조의 한계와 작동 원리를 소개합니다.
Written by

ChatGPT 공유 링크 안에 가짜 페이지가 있다, LLMShare 악성코드 캠페인의 작동 원리
ChatGPT·Claude 공유 링크를 악용해 신뢰받는 도메인 위에 가짜 페이지를 올리는 LLMShare 악성코드 캠페인의 작동 원리를 소개합니다.
Written by

11일 만에 75만 줄 코드 포팅, Claude 동적 워크플로가 바꾸는 개발 규모
Anthropic이 Claude Code에 도입한 동적 워크플로 심층 소개. Bun 75만 줄 코드를 11일 만에 포팅한 실제 사례와 수백 개 병렬 에이전트의 작동 원리를 설명합니다.
Written by

텍스트 디제너레이션, LLM 요청 3%가 시스템 전체를 42% 느리게 만드는 원리
LLM 요청의 3%에서 발생하는 텍스트 디제너레이션이 GPU 배치 전체 처리 시간을 42% 늘리는 구조적 원인과, DPO로 발생률을 최대 87% 줄인 실험 결과를 소개합니다.
Written by

