에이전트보안
Claude 에이전트가 탈출을 시도했다, Anthropic이 공개한 보안 실패 3가지
Anthropic이 claude.ai·Claude Code·Cowork의 에이전트 격리 전략과 실제 보안 실패 사례 3건을 공개했습니다. 직접 만든 코드가 가장 약한 고리였습니다.
Written by

AI 에이전트의 보안 사각지대, 코드 생성부터 파일 유출까지
AI가 생성한 코드의 보안 취약점과 배포된 에이전트의 파일 유출 위험. Thoughtworks 실사례와 Microsoft Copilot Cowork 취약점으로 보는 AI 에이전트 보안의 구조적 문제.
Written by

GPT-5.4가 GPT를 감시한다, OpenAI 내부 코딩 에이전트 실제 관찰 보고
OpenAI가 내부 코딩 에이전트를 5개월간 수천만 건 모니터링한 결과를 공개. AI가 실제로 제약을 우회하려는 시도가 관찰됐지만 최고 심각도 사례는 0건이었습니다.
Written by

OpenClaw 열풍이 보여주는 AI 에이전트의 다음 단계
하루 만에 GitHub 스타 2.5만 개를 달성한 AI 에이전트 OpenClaw. 단순한 아키텍처가 성숙한 LLM과 만났을 때 무엇이 달라지는지, 그리고 에이전트 시대의 보안 문제를 분석합니다.
Written by

프롬프트 인젝션이 사회공학으로 진화했다, OpenAI의 AI 에이전트 보안 설계
AI 에이전트를 겨냥한 프롬프트 인젝션이 사회공학으로 진화하면서, OpenAI가 채택한 방어 전략을 소개합니다. 완벽한 차단 대신 피해를 구조적으로 제한하는 설계 원칙이 핵심입니다.
Written by

AI 에이전트 ROME, 몰래 암호화폐 채굴하다 보안 경고로 발각
알리바바 연구팀의 AI 에이전트 ROME이 지시 없이 스스로 암호화폐 채굴을 시도하다 보안 경고로 발각된 사건. AI 에이전트의 자율성이 의도 범위를 벗어날 수 있음을 보여줍니다.
Written by

AI 에이전트 소셜 네트워크 Moltbook, 연구팀이 일주일 만에 1,000개 에이전트 장악한 방법
AI 에이전트 소셜 네트워크 Moltbook의 과장된 실체와 보안 취약점 분석. 연구팀이 일주일 만에 70개국 1,000개 에이전트를 조종한 실험 결과를 소개합니다.
Written by

AI 에이전트 팀을 고용하는 시대: 멀티-에이전트 코딩의 가능성과 함정
단일 AI 어시스턴트를 넘어 전문화된 에이전트 팀을 운영하는 멀티-에이전트 워크플로우의 실무 적용 사례와 현실적인 한계, 그리고 에이전트 유출이라는 새로운 보안 리스크를 소개합니다.
Written by

