AI에이전트
퍼스널 AI가 바꾸는 서비스 구조, 헤드리스화가 시작됐다
AI 에이전트가 서비스를 대신 사용하는 시대, 모든 앱이 CLI·API 기반 헤드리스 구조로 전환해야 하는 이유를 Matt Webb의 분석으로 살펴봅니다.
Written by

같은 모델로 Top 30에서 Top 5로, 하네스 엔지니어링이 바꾸는 것
같은 Claude 모델로 하네스만 바꿔 Terminal Bench Top 30→Top 5를 달성한 사례. AI 에이전트 성능의 진짜 변수는 모델이 아니라 하네스임을 설명합니다.
Written by

Google A2UI v0.9, AI 에이전트가 앱 화면을 실시간으로 조립하는 방법
Google이 공개한 AI 에이전트용 생성형 UI 표준 A2UI v0.9 소개. 에이전트가 기존 디자인 시스템을 활용해 대화 맥락에 맞는 UI를 실시간으로 조립하는 방법을 설명합니다.
Written by

AI 에이전트 개발의 함정, LLM에 계산 맡기면 반드시 실패한다
Google AI Agent Bake-Off 실전 해커톤에서 나온 교훈. LLM 역할 분리, 모듈식 설계, 결정론적 실행으로 프로덕션급 에이전트를 만드는 법을 소개합니다.
Written by

OpenAI Codex 대변신, 코딩 도구에서 Mac 전체를 다루는 슈퍼앱으로
OpenAI Codex가 코딩 도구를 넘어 Mac 전체를 제어하는 AI 에이전트로 진화했습니다. 백그라운드 컴퓨터 사용과 슈퍼앱 전략을 소개합니다.
Written by

Claude Opus 4.7 출시, 에이전트 자율성과 비전 해상도 대폭 향상
Anthropic이 Claude Opus 4.7을 출시했습니다. 에이전트 자율성과 비전 해상도가 크게 향상됐으며, 사이버 보안 안전장치도 처음으로 적용됐습니다.
Written by

AI 분신이 나 대신 만남을 주선한다, Pixel Societies의 실험
AI 에이전트가 나 대신 가상 공간을 돌아다니며 연인·친구 후보를 찾아주는 Pixel Societies. 흥미로운 실험이지만, 심리학 연구가 말하는 ‘궁합 예측의 한계’와 맞닥뜨립니다.
Written by

Claude Code에 자동화 루틴 추가, 스케줄·API·GitHub 이벤트로 실행
Anthropic이 Claude Code에 Routines를 추가했습니다. 스케줄·API·GitHub 이벤트로 자동 실행되는 클라우드 기반 자동화 기능으로, 버그 수정부터 PR 리뷰까지 자동화할 수 있습니다.
Written by

AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다
AI 에이전트 스킬이 벤치마크와 달리 현실 조건에서 성능 이점이 거의 사라진다는 연구 결과. 34,000개 실제 스킬로 테스트한 UC Santa Barbara·MIT 연구팀의 분석.
Written by

