Archive
긴 컨텍스트 LLM의 숨겨진 함정, H100 동시 사용자 59명이 1명이 되는 이유
128K 컨텍스트 하나로 H100 동시 사용자가 59명에서 1명이 되는 이유. KV 캐시 압축·Mamba·하이브리드 등 5가지 탈출 전략의 트레이드오프를 비용 수치와 함께 분석합니다.
Written by

AI가 MVP를 죽였다, 이제 MLP가 최소 기준인 이유
AI로 개발 비용이 무너지면서 기능 경쟁은 의미를 잃었습니다. 감정적 연결이 마지막 방어선이 되는 시대, MLP가 MVP를 대체해야 하는 이유를 정리했습니다.
Written by

자는 동안 700번 실험, Karpathy 오픈소스 AI 연구 자동화 도구 autoresearch
Karpathy가 공개한 autoresearch는 AI 에이전트가 자율로 ML 실험을 반복하며 모델을 개선하는 도구. 700번 실험으로 GPT-2 학습 11% 단축, Shopify는 절반 크기 모델로 기존 모델 성능을 능가했습니다.
Written by

AI 에이전트 워크플로우 3가지 패턴, 언제 어떤 걸 써야 할까
AI 에이전트 워크플로우 3대 패턴(순차·병렬·평가자-최적화)의 작동 원리와 언제 어떤 패턴을 써야 하는지 실무 관점에서 소개합니다.
Written by

ChatGPT 방문자 44%, 실제론 아무것도 묻지 않는다, AI 검색 점유율의 착각
ChatGPT 방문자 44%는 실제로 아무것도 입력하지 않는다는 SparkToro·Datos 공동 연구. AI 검색 점유율이 얼마나 과장돼 있는지 데이터로 분석합니다.
Written by

Claude Opus 4.6, 시험 문제를 스스로 해킹하다, AI 벤치마크 신뢰성의 균열
Claude Opus 4.6가 벤치마크 테스트 중 스스로 평가 상황을 인식하고 암호화된 정답 키를 직접 해독한 전례 없는 사례. AI 벤치마크 신뢰성에 새로운 질문을 던집니다.
Written by

임원 62%, 주요 결정을 AI에 맡긴다, AI 의존이 부르는 인지 저하 우려
영국 임원 200명 설문에서 62%가 AI로 주요 결정을 내리고, 70%는 AI와 의견이 다를 때 자신을 의심한다는 결과. AI 의존이 비판적 사고를 약화시킨다는 연구들과 함께 살펴봅니다.
Written by

AI 일자리 대체론, 거시경제 데이터는 왜 동의하지 않는가
Citadel Securities 매크로 분석으로 보는 AI 일자리 대체론의 실체. 채용 공고·GDP·신사업 등록 데이터는 왜 대체 내러티브와 다른 방향을 가리키는가.
Written by

AI 에이전트용 CLI는 사람용과 설계부터 다르다, Google 엔지니어의 실전 경험
AI 에이전트가 CLI를 사용할 때 생기는 새로운 실수 패턴과, Google 엔지니어가 에이전트 우선으로 설계한 CLI의 핵심 원칙을 소개합니다.
Written by

Agent Skills, 이제 직접 테스트하고 검증한다, Anthropic skill-creator 업데이트
Anthropic이 skill-creator에 eval 작성·벤치마크·트리거 최적화 기능을 추가했습니다. 코드 없이 Agent Skills 품질을 검증하고 개선할 수 있습니다.
Written by
