AI평가
-
Grok 4.1, LMArena 1위 등극: AI 경쟁이 ‘감성’으로 옮겨간 이유
xAI의 Grok 4.1이 LMArena 1위를 차지했습니다. 성능이 아닌 감성지능과 신뢰성으로 차별화한 전략과 AI 경쟁의 새로운 방향을 분석합니다.
Written by

-
GPT-5 패밀리, RAG에서도 통할까? – 새로운 모델들의 실전 성능 평가
GPT-5 모델 패밀리의 RAG 시스템 성능을 실제 데이터로 평가한 결과와 실무 적용 가이드. 특히 할루시네이션 감소와 “모르겠다”고 답변하는 능력 향상에 주목한 종합 분석입니다.
Written by

