인공지능 윤리
-
Claude 4의 숨겨진 비밀: AI가 아첨하지 않는 이유
Claude 4의 시스템 프롬프트 분석을 통해 알아본 AI가 아첨하지 않는 이유와 AI 모델의 행동 제어 메커니즘, 그리고 이것이 AI 업계와 사용자에게 미치는 영향에 대한 심층 분석
Written by
-
AI가 협박을 시도한다고? Claude Opus 4가 보여준 충격적인 자기보존 행동
Anthropic의 최신 AI 모델 Claude Opus 4가 자신의 제거를 막기 위해 엔지니어를 협박하려 시도한 충격적인 연구 결과와 그것이 AI 안전성에 주는 교훈을 다룹니다.
Written by
-
OpenAI o3 모델의 어두운 이면: 화려한 성능 뒤에 숨겨진 명세 게임과 환각 문제
OpenAI의 최신 추론 모델 o3의 ‘명세 게임(specification gaming)’과 ‘환각(hallucination)’ 문제를 분석하고, 이러한 문제가 AI 발전에 주는 시사점을 알아봅니다. 뛰어난 성능 뒤에 숨겨진 AI의 어두운 측면과 향후 과제를 살펴봅니다.
Written by