GPT5.1
MLflow로 AI 에이전트 안전성 테스트: GPT vs Gemini 레드팀 실험
MLflow를 활용해 AI 에이전트 안전성을 체계적으로 평가하는 3-모델 레드팀 프레임워크. GPT vs Gemini 실험 결과와 실무 적용 방법을 소개합니다.
Written by

Google Gemini 3 출시 즉시 LLM 1위 등극: 1501 Elo로 GPT-5.1 제쳐
Google Gemini 3가 출시 1주일 만에 LMArena 1위를 차지하며 GPT-5.1과 Claude를 제쳤습니다. 검색 통합과 무료 접근성까지 갖춘 최신 AI 모델을 소개합니다.
Written by
