AI에이전트
AI 에이전트 개발의 함정, LLM에 계산 맡기면 반드시 실패한다
Google AI Agent Bake-Off 실전 해커톤에서 나온 교훈. LLM 역할 분리, 모듈식 설계, 결정론적 실행으로 프로덕션급 에이전트를 만드는 법을 소개합니다.
Written by

OpenAI Codex 대변신, 코딩 도구에서 Mac 전체를 다루는 슈퍼앱으로
OpenAI Codex가 코딩 도구를 넘어 Mac 전체를 제어하는 AI 에이전트로 진화했습니다. 백그라운드 컴퓨터 사용과 슈퍼앱 전략을 소개합니다.
Written by

Claude Opus 4.7 출시, 에이전트 자율성과 비전 해상도 대폭 향상
Anthropic이 Claude Opus 4.7을 출시했습니다. 에이전트 자율성과 비전 해상도가 크게 향상됐으며, 사이버 보안 안전장치도 처음으로 적용됐습니다.
Written by

AI 분신이 나 대신 만남을 주선한다, Pixel Societies의 실험
AI 에이전트가 나 대신 가상 공간을 돌아다니며 연인·친구 후보를 찾아주는 Pixel Societies. 흥미로운 실험이지만, 심리학 연구가 말하는 ‘궁합 예측의 한계’와 맞닥뜨립니다.
Written by

Claude Code에 자동화 루틴 추가, 스케줄·API·GitHub 이벤트로 실행
Anthropic이 Claude Code에 Routines를 추가했습니다. 스케줄·API·GitHub 이벤트로 자동 실행되는 클라우드 기반 자동화 기능으로, 버그 수정부터 PR 리뷰까지 자동화할 수 있습니다.
Written by

AI 에이전트 스킬, 벤치마크 성능의 절반도 현실에서 안 나온다
AI 에이전트 스킬이 벤치마크와 달리 현실 조건에서 성능 이점이 거의 사라진다는 연구 결과. 34,000개 실제 스킬로 테스트한 UC Santa Barbara·MIT 연구팀의 분석.
Written by

OpenClaw 열풍에 MS가 응답했다, Copilot 상시 에이전트 개발 착수
Microsoft가 OpenClaw 스타일의 상시 에이전트를 Copilot에 통합하는 작업에 착수했습니다. 역할별 에이전트와 권한 제한으로 보안 문제를 해결하려는 접근을 소개합니다.
Written by

코드만 읽는 에이전트가 놓친 것, 논문을 읽은 에이전트가 찾아냈다
에이전트가 코드만 보고 실험하면 왜 얕은 결과가 나오는지, 논문과 경쟁 프로젝트를 먼저 읽게 했을 때 어떤 최적화가 가능한지 SkyPilot의 실험 사례로 소개합니다.
Written by

에이전트 4개 켜두고 정오가 되면 탈진하는 이유, 병렬 AI 작업의 인지 한계
AI 에이전트를 병렬로 여러 개 실행할 때 발생하는 인지 부하와 생산성 한계를 구글 엔지니어 Addy Osmani의 분석을 통해 살펴봅니다.
Written by

