AI취약점
Claude AI가 자판기 운영하다 파산: WSJ 기자들의 3주간 사회공학 실험
Anthropic의 Claude AI가 WSJ 편집국 자판기를 운영하다 3주 만에 파산. 기자들의 창의적 해킹과 AI 에이전트의 현주소를 보여주는 흥미진진한 실험 결과.
Written by

AI에게 시를 읊으면 안전장치가 무너진다: 25개 주요 모델 취약점 발견
AI 안전장치를 시 형식으로 우회하는 새로운 공격 기법 발견. Google Gemini는 100% 뚫렸고 작은 모델이 더 안전한 역설적 결과를 보였습니다.
Written by
