복잡한 AI 세상을 읽는 힘
최근 발표된 ‘리더보드 환상(The Leaderboard Illusion)’ 연구를 통해 Chatbot Arena와 같은 AI 벤치마크의 문제점과 Meta의 Llama 4 사례를 살펴보고, AI 모델 평가의 미래 방향성에 대해 논의합니다.
Written by