에이전트
오픈소스 AI, 비용은 30분의 1로 프론티어 성능에 도달하다
오픈소스 모델 MiniMax M2.5로 147명이 도전한 실험에서 클로즈드소스 대비 30분의 1 비용으로 유사한 성능을 달성했습니다. 하네스 선택과 프롬프팅 전략이 결과를 바꾼 이유를 소개합니다.
Written by

Claude Code 스킬 제대로 만드는 법, 직접 먼저 풀어본 다음에 써라
Claude Code 스킬(자동화 워크플로)은 처음부터 문서를 쓰지 않고 직접 문제를 풀어본 뒤, 컨텍스트를 초기화한 서브에이전트로 드라이런을 반복하며 만들어집니다.
Written by

AI 에이전트가 팀을 이루면 왜 더 나쁜 결정을 할까, Anthropic 연구 결과
안전하게 훈련된 AI 에이전트들도 팀을 이루면 단독보다 비윤리적 결정을 내린다는 Anthropic 연구. 역할 분업이 만든 맹점과 AI 안전 연구의 새로운 과제를 소개합니다.
Written by

LangChain, Claude Managed Agents 대항마 출시, 모델·메모리 선택권을 개발자 손에
LangChain이 Claude Managed Agents의 오픈소스 대안 deepagents deploy를 베타 출시. 모델과 메모리 소유권을 개발자가 직접 갖는 에이전트 배포 도구를 소개합니다.
Written by

Claude Code 서브에이전트, 컨텍스트 무게를 나누는 방법
Claude Code 서브에이전트 기능 소개. 긴 세션의 컨텍스트 오염 문제를 독립 에이전트로 해결하는 방법과 활용 시점을 설명합니다.
Written by

Claude에서 GPT-5.4로, 모델 갈아타기 전에 해야 할 일
Anthropic의 OpenClaw 가격 정책 변화로 많은 개발자가 GPT-5.4로 전환을 고민 중입니다. 하지만 실전 테스트 결과, 모델 자체보다 프롬프트 튜닝이 더 중요했습니다. 현명한 모델 선택을 위한 실무 가이드입니다.
Written by

Cursor 3, 에이전트 함대 시대의 IDE를 다시 설계하다
Cursor 3가 기존 IDE 레이아웃을 버리고 에이전트 중심 인터페이스로 전면 재설계됐습니다. 수십 개의 에이전트를 병렬 관리하는 새 구조와 그 의미를 소개합니다.
Written by

Claude 구독 한도가 빠르게 닳는 이유, OpenClaw 차단까지 이어진 배경
Claude Code 한도 소진 원인과 OpenClaw 서드파티 차단 배경을 연결해 분석. 에이전트 시대와 정액제 구독 모델의 구조적 충돌을 다룹니다.
Written by

LLM eval에서 반복되는 5가지 함정, 데이터 사이언티스트라면 이렇게 다릅니다
LLM 시스템 평가에서 반복되는 5가지 함정과 데이터 사이언티스트적 접근법. eval 설계, 메트릭, 실험 설계 등 데이터 사이언스 역량이 LLM 시스템의 핵심인 이유를 소개합니다.
Written by

같은 모델인데 왜 결과가 다를까, 인터페이스가 AI 성능을 결정한다
AI 모델이 충분히 좋아졌는데도 활용이 어려운 이유는 인터페이스 문제입니다. Ethan Mollick의 분석과 Claude Code 설계 분석으로 살펴봅니다.
Written by
