언어모델안전
AI에게 시를 읊으면 안전장치가 무너진다: 25개 주요 모델 취약점 발견
AI 안전장치를 시 형식으로 우회하는 새로운 공격 기법 발견. Google Gemini는 100% 뚫렸고 작은 모델이 더 안전한 역설적 결과를 보였습니다.
Written by

최신 AI 쉽게 깊게 따라잡기⚡
AI 안전장치를 시 형식으로 우회하는 새로운 공격 기법 발견. Google Gemini는 100% 뚫렸고 작은 모델이 더 안전한 역설적 결과를 보였습니다.
Written by

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)