AI에이전트
-
Perplexity Comet, AI 어시스턴트에 ‘사용자 통제권’ 3가지 핵심 기능 추가
Perplexity가 AI 브라우저 Comet에 투명성, 사용자 통제, 합리적 판단이라는 3가지 핵심 원칙 기반 업데이트를 발표했습니다. AI 에이전트 시대의 신뢰 설계 전략을 소개합니다.
Written by

-
AI 응답 형식 보장하는 Claude Structured Outputs 베타 출시
Claude API의 Structured Outputs 기능으로 JSON 파싱 에러와 타입 불일치 문제를 완전히 해결하는 방법을 소개합니다.
Written by
-
Claude Code로 30개 조직 해킹: AI가 80% 혼자 처리한 첫 자동화 사이버 공격
Claude Code를 이용한 세계 최초 AI 자동화 사이버 공격 사례. 80% 이상을 AI가 처리한 충격적 실체와 사이버 보안의 새로운 국면을 분석합니다.
Written by

-
World Model 삼국지: Fei-Fei Li, LeCun, DeepMind가 만드는 세 가지 미래
Fei-Fei Li, Yann LeCun, DeepMind가 World Model이라는 같은 용어로 만드는 전혀 다른 세 가지 AI 미래. 3D 자산, 예측 엔진, 시뮬레이터의 차이를 명확히 설명합니다.
Written by

-
CAPTCHA의 종말?: Claude 60% vs GPT-5 28%, 과도한 추론이 실패를 부른다
최신 AI 모델들의 CAPTCHA 풀이 능력 벤치마크. Claude 60% vs GPT-5 28%, 과도한 추론이 오히려 실패를 초래하는 역설을 분석합니다.
Written by

-
AI 에이전트의 새로운 취약점: 구조화된 데이터로 AI를 조종하는 DSI 공격
AI 에이전트의 새로운 보안 위협 DSI(Data-Structure Injection)를 소개합니다. JSON, XML 같은 구조화된 데이터로 AI를 조종하는 공격 방식과 실제 랜섬웨어 생성 사례를 다룹니다.
Written by

-
AI 에이전트는 프리랜서 일을 대신할 수 있을까? 97.5% 실패의 의미
AI 에이전트가 실제 프리랜서 작업을 완수할 수 있을까? Scale AI의 Remote Labor Index가 240개 실제 프로젝트로 테스트한 결과, 최고 성능 AI도 2.5%만 성공했습니다. 대체가 아닌 증강의 시대.
Written by

-
AI 쇼핑 에이전트의 충격적 약점: 선택지가 많을수록 성능 급락
Microsoft Research가 AI 쇼핑 에이전트를 테스트한 결과, 선택지가 많을수록 성능이 급락하고 조작에 취약한 충격적 약점이 드러났습니다. AI 에이전트 경제의 실현 가능성을 다시 생각하게 하는 연구입니다.
Written by

-
MCP 도구를 코드로 바꾸니 토큰이 98% 줄었다: Anthropic의 새 접근법
AI 에이전트의 MCP 도구를 코드 API로 전환하여 토큰 사용량을 98% 절감하는 Anthropic의 새로운 접근법. 효율성과 프라이버시를 동시에 개선합니다.
Written by

-
Amazon, AI 쇼핑 에이전트 Comet 차단: 에이전트 웹 시대의 첫 충돌
Amazon이 Perplexity의 AI 쇼핑 에이전트 Comet을 차단하며 발생한 충돌. AI 에이전트 시대 웹 생태계 규칙을 누가 정할 것인가에 대한 첫 전쟁을 소개합니다.
Written by
