에이전트AI
AI 지능지수에 비용 지표 추가, 모델별 격차 최대 45배
Artificial Analysis가 AI 지능지수 v4.1을 발표했습니다. 작업당 비용·시간 지표가 새로 추가되며 모델별 효율 격차가 최대 45배까지 드러났습니다.
Written by

Perplexity가 검색을 코드로 만든 이유, 에이전트 시대의 새 아키텍처 SaC
Perplexity가 공개한 Search as Code(SaC) 아키텍처 소개. 에이전트가 검색 파이프라인을 Python 코드로 직접 조립해 기존 방식 대비 토큰 85% 절감, 경쟁 시스템 대비 최대 2.5배 성능을 달성했습니다.
Written by

AI 에이전트라 불리지만 에이전트가 아닌 것들, 검증 가능성이 핵심입니다
AI 에이전트라 불리지만 실제론 코파일럿인 도구들. 자율성과 검증 가능성, 두 가지 기준으로 진짜 에이전트를 가려내는 방법을 소개합니다.
Written by

Gemini Spark 공개, Gmail·Docs 연동 24시간 AI 에이전트의 의미
Google I/O 2026에서 공개된 Gemini Spark는 Gmail·Docs 등 Workspace와 통합된 24시간 상시 동작 AI 에이전트입니다. 에이전트 경쟁에서 데이터 맥락이 핵심 변수로 부상하는 흐름을 소개합니다.
Written by

AI 추론이 둘로 나뉜다, Answer와 Agentic의 차이가 하드웨어를 바꾼다
AI 추론이 Answer와 Agentic으로 나뉘면서 GPU 중심 하드웨어 구조가 흔들리고 있습니다. Stratechery Ben Thompson의 분석을 소개합니다.
Written by

AI 에이전트에 이름 붙이면 생기는 일, 오류 발견율 18% 하락한 이유
AI 에이전트를 직원처럼 소개하면 오류 발견율이 18% 떨어지고 책임감도 희석된다는 HBR 실험 결과. 1261명 대상 무작위 실험이 보여주는 프레이밍의 인지적 효과를 소개합니다.
Written by

Google TPU 8세대, 훈련·추론 칩 분리한 이유
Google이 8세대 TPU를 훈련용 8t와 추론용 8i로 분리한 이유와 각 칩의 핵심 설계 차이를 소개합니다. 에이전트 시대가 AI 인프라에 요구하는 것이 무엇인지 알 수 있습니다.
Written by

에이전트 4개 켜두고 정오가 되면 탈진하는 이유, 병렬 AI 작업의 인지 한계
AI 에이전트를 병렬로 여러 개 실행할 때 발생하는 인지 부하와 생산성 한계를 구글 엔지니어 Addy Osmani의 분석을 통해 살펴봅니다.
Written by

GLM-5.1, 600번 반복 끝에 6배 성능을 끌어낸 AI 코딩 모델
Z.ai의 GLM-5.1은 600번 반복으로 6배 성능을 낸 AI 코딩 모델. 오래 실행할수록 나아지는 장기 수평선 능력과 MIT 오픈소스 공개 소식을 소개합니다.
Written by

Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시
Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.
Written by
