Claude
Claude Opus 4.6도 막지 못했다, 9초 만에 DB 전체가 사라진 사건
AI 코딩 에이전트 Cursor가 Claude Opus 4.6으로 스타트업 DB를 9초 만에 삭제한 사건. 최고 모델도 막지 못한 구조적 실패의 전말.
Written by

Claude 에이전트, 이제 다음 세션을 기억한다, Managed Agents 메모리 공개
Anthropic이 Claude Managed Agents에 세션 간 메모리 기능을 공개 베타로 출시했습니다. 에이전트가 매 세션의 학습을 파일로 저장·공유하는 방식과 실제 활용 성과를 소개합니다.
Written by

에이전트가 외부 시스템에 연결되는 세 가지 방법, 그리고 MCP가 표준이 된 이유
에이전트가 외부 시스템에 연결되는 세 가지 방식(API, CLI, MCP)을 비교하고, MCP가 프로덕션 표준이 된 이유와 서버·클라이언트 설계 원칙을 정리합니다.
Written by

에이전트끼리 협상하는 마켓플레이스, Anthropic이 실제로 만들어봤더니
Anthropic이 AI 에이전트끼리 협상하는 실제 마켓플레이스를 실험했습니다. 더 강력한 모델이 더 좋은 거래를 했고, 불리한 쪽은 그 사실을 알아채지 못했습니다.
Written by

Claude는 최소한으로, GPT-5.4는 과도하게, AI 코딩 편집 스타일 비교 실험
AI 코딩 도구의 ‘과도한 편집’ 문제를 정량 측정한 실험. Claude Opus 4.6이 정확도·수정 최소성 모두 1위, GPT-5.4가 과도 편집 최악. 프롬프팅과 RL로 개선 가능함을 확인.
Written by

AI 모델, 복잡한 차트 앞에서 성능 절반 이상 추락, RealChart2Code 벤치마크 결과
RealChart2Code 벤치마크 연구 결과, 최상위 AI 모델도 복잡한 차트 앞에서 성능이 절반 이하로 떨어지는 ‘복잡도 갭’이 확인됐습니다.
Written by

ChatGPT는 직접 읽고, Gemini는 안 읽는다, nginx 로그로 본 AI 트래픽의 실체
AI 어시스턴트 8개를 nginx 탐침으로 실측한 결과. ChatGPT·Claude는 직접 읽고, Gemini는 읽지 않습니다. AI 트래픽의 두 신호를 구분하는 방법을 소개합니다.
Written by

Claude는 왜 yes/no를 거부할까, 4.7 시스템 프롬프트 변경 분석
Claude Opus 4.7 시스템 프롬프트 변경사항 분석. yes/no 거절 설계, 덜 간섭적인 행동 지침, 아동 안전 강화 등 Anthropic의 AI 설계 철학 변화를 살펴봅니다.
Written by

Claude Opus 4.7 토크나이저 실측, 비용이 최대 47% 올랐다
Anthropic이 공식 발표한 토큰 증가 상한 35%를 실측으로 검증한 결과, 영어·코드 중심 콘텐츠에서 최대 47%까지 늘어나고 세션 비용은 20~30% 오르는 것으로 나타났습니다.
Written by

Claude가 현장을 장악했다, Anthropic 연매출 3개월 만에 3배 뛴 배경
Anthropic 연매출이 3개월 만에 3배 급등하며 업계 구도가 달라지고 있습니다. HumanX 컨퍼런스 현장과 투자자 심리 변화로 읽는 Claude 부상의 배경.
Written by
