굿하트의법칙
AI 에이전트는 왜 아직 사람이 필요한가, goose 팀의 자기개선 루프
“AI가 스스로 발전한다”는 유행 속에서 오픈소스 에이전트 goose 팀이 자기개선 루프에 여전히 사람을 끼워 넣는 이유. 벤치마크를 버그 리포트로 보는 관점을 소개합니다.
Written by

토큰맥싱, 아마존 직원들이 AI 리더보드 점수를 조작하는 이유
아마존 직원들이 내부 AI 리더보드 점수를 올리기 위해 불필요한 작업에 AI를 쓰는 ‘토큰맥싱’ 현상. AI 도입 압박이 만들어낸 왜곡된 인센티브를 분석합니다.
Written by

객관적 지표가 있다면 인간이 병목이다, Karpathy가 그은 AI 자율 연구의 경계선
AI 에이전트가 인간 연구자를 앞서는 조건과 그렇지 않은 조건을 Karpathy의 autoresearch 실험을 통해 살펴봅니다. 측정 가능성이 자율 연구의 경계선인 이유.
Written by
