AI엔지니어링
AI 에이전트도 온보딩이 필요하다, 에이전트 시대의 5가지 코드 레이어
AI 코딩 에이전트가 “내 것 같지 않은” 코드를 만드는 이유와, 인간·에이전트가 같은 방향으로 일하게 만드는 5개 레이어 프레임워크를 소개합니다.
Written by

재귀적 자기개선 루프, 개발자가 알아야 할 진짜 작동 방식
AI가 스스로를 개선하는 재귀적 루프의 실제 작동 원리와 실패 패턴. STaR부터 AlphaEvolve까지 2022~2025년 핵심 사례와 리워드 해킹, 평가자 표류 등 주의해야 할 함정을 정리합니다.
Written by

LLM eval에서 반복되는 5가지 함정, 데이터 사이언티스트라면 이렇게 다릅니다
LLM 시스템 평가에서 반복되는 5가지 함정과 데이터 사이언티스트적 접근법. eval 설계, 메트릭, 실험 설계 등 데이터 사이언스 역량이 LLM 시스템의 핵심인 이유를 소개합니다.
Written by

LLM 파이프라인 통과율 37%→94%, 블랙잭으로 증명한 설계 원칙
LLM 파이프라인 통과율을 37%에서 94%로 높인 블랙잭 실험 분석. “LLM이 할 수 있다”와 “LLM이 해야 한다”는 다르다는 설계 원칙을 데이터로 증명합니다.
Written by

에이전트 혼자 두면 안 되는 이유, Anthropic의 하네스 설계 실험
솔로 에이전트 $9 vs 하네스 $200, 같은 모델도 시스템 설계에 따라 결과가 달라집니다. Anthropic이 컨텍스트 불안과 자기평가 편향을 구조적으로 해결한 하네스 설계 실험을 소개합니다.
Written by
