AI 기술 분석
Claude Code 언어별 비용 실험, 동적 타입이 정적 타입보다 최대 2.6배 저렴했다
Claude Code로 13개 언어의 코딩 비용과 속도를 실험한 결과. Ruby·Python·JS가 정적 타입 언어보다 최대 2.6배 빠르고 저렴했습니다. AI 코딩 에이전트와 언어 선택의 관계를 데이터로 분석합니다.
Written by

GitHub 이슈 제목 하나로 개발자 4,000대가 뚫렸다, Clinejection 공격 해부
GitHub 이슈 제목 하나로 시작된 프롬프트 인젝션이 5단계 연쇄 공격으로 이어져 개발자 4,000대에 무단 AI 설치. Clinejection 공격의 구조와 의미를 분석합니다.
Written by

Perplexity pplx-embed, 구글·알리바바 수준 성능에 메모리 32배 절약
Perplexity가 공개한 오픈소스 임베딩 모델 pplx-embed. 구글·알리바바 수준 성능을 유지하면서 메모리는 최대 32배 절약하는 양자화 기술을 적용했습니다.
Written by

마리오로 이해하는 에이전틱 AI, 슈퍼버섯부터 강화학습까지
마리오 게임 비유로 에이전틱 AI의 기반 모델, 모델 하네스, 도구, 강화학습을 쉽게 설명합니다. ML 엔지니어 Han Lee의 원문 큐레이션.
Written by

AI 에이전트가 spec을 직접 업데이트한다, Augment Intent의 접근법
개발자가 문서를 업데이트하지 않는 문제, AI 에이전트 시대엔 더 심각합니다. Augment Intent가 에이전트 스스로 spec을 업데이트하게 만든 방법을 소개합니다.
Written by

AI 이미지 검색이 실패하는 이유, 못 보는 게 아니라 못 계획하는 것
AI 이미지 검색이 개인 사진첩에서 맥락 기반 검색에 실패하는 근본 원인 분석. 최신 모델도 정답률 29% 수준, 문제는 시각이 아닌 멀티스텝 추론 능력.
Written by

MCP 컨텍스트 문제 99.9% 해결한 Cloudflare의 Code Mode
Cloudflare가 공개한 Code Mode MCP 서버. search()와 execute() 두 도구만으로 2,500개 API를 1,000 토큰에 커버, 기존 대비 99.9% 절감한 접근법을 소개합니다.
Written by

Diffusion LLM 추론 속도 14배 높인 CDLM, 두 가지 병목을 동시에 푼 방법
Together.ai가 공개한 CDLM은 Diffusion Language Model의 추론 속도를 최대 14배 높이는 포스트 트레이닝 기법입니다. KV 캐시 문제와 과도한 정제 스텝, 두 가지 병목을 동시에 해결합니다.
Written by

Anthropic vs OpenAI 빠른 추론, 같은 듯 전혀 다른 두 가지 방법
Anthropic과 OpenAI가 동시에 발표한 fast mode, 사실 작동 원리가 완전히 다릅니다. 배칭 조정 vs 웨이퍼 크기 칩, 두 가지 방식의 차이와 트레이드오프를 분석합니다.
Written by

AI 모델 실행 비용 절반으로, Dropbox가 설명하는 Low-bit 추론 최적화
AI 모델 실행 비용을 절반으로 줄이는 Low-bit 추론 기술. Dropbox가 설명하는 양자화 기법과 MXFP 포맷의 실무 적용 사례를 소개합니다.
Written by
