에이전트설계
LLM 파이프라인 통과율 37%→94%, 블랙잭으로 증명한 설계 원칙
LLM 파이프라인 통과율을 37%에서 94%로 높인 블랙잭 실험 분석. “LLM이 할 수 있다”와 “LLM이 해야 한다”는 다르다는 설계 원칙을 데이터로 증명합니다.
Written by

AI 에이전트 성능을 좌우하는 하네스 설계, LangChain이 정리한 핵심 구조
에이전트 성능을 결정하는 건 모델만이 아닙니다. LangChain이 ‘하네스’의 개념과 파일시스템·샌드박스·컨텍스트 관리 등 핵심 구성요소를 체계적으로 정리했습니다.
Written by

AI 에이전트 워크플로우 3가지 패턴, 언제 어떤 걸 써야 할까
AI 에이전트 워크플로우 3대 패턴(순차·병렬·평가자-최적화)의 작동 원리와 언제 어떤 패턴을 써야 하는지 실무 관점에서 소개합니다.
Written by

AI 에이전트 성능을 가르는 두 가지 설계 원칙, 이너 루프와 AGENTS.md
AI 에이전트 성능을 결정하는 이너 루프(자기 검증)와 아우터 루프(세션 간 학습), AGENTS.md 작성 원칙을 ETH 취리히 연구 데이터와 함께 소개합니다.
Written by

AI 코딩 에이전트 비용, 대화할수록 폭발하는 이유와 해결책
AI 코딩 에이전트는 대화가 길어질수록 캐시 읽기 비용이 2차 함수로 폭증합니다. 실제 250개 대화 데이터로 분석한 비용 구조와 그 원인을 소개합니다.
Written by

긴 컨텍스트 LLM의 숨겨진 함정, Context Rot 현상과 RLM 해결책
긴 컨텍스트를 처리할 때 LLM 성능이 저하되는 Context Rot 현상과, 이를 해결하는 RLM(Recursive Language Model) 접근법을 소개합니다.
Written by

AI 에이전트에게 bash만 주면 될까, Vercel과 Braintrust의 실전 테스트
AI 에이전트에게 bash만 주면 충분할까? Vercel과 Braintrust가 실전 테스트한 결과, SQL이 압도적 우위를 보였고 하이브리드 접근법이 가장 안정적이었습니다.
Written by

AI 에이전트 설계의 갈림길: MCP vs Skills, 실무자가 말하는 진짜 차이
Flask 창시자가 분석한 AI 에이전트 설계의 두 갈래: MCP vs Skills. 누가 제어권을 쥐느냐에 따라 달라지는 실무 차이를 소개합니다.
Written by

AI 에이전트 설계는 여전히 어렵다: Flask 개발자가 밝힌 실전 교훈
Flask 개발자 Armin Ronacher가 수개월간 AI 에이전트를 구축하며 발견한 실전 교훈. SDK 선택, 명시적 캐싱, 강화 전략 등 현장에서 작동하는 설계 원칙을 소개합니다.
Written by
