에이전트AI
Google TPU 8세대, 훈련·추론 칩 분리한 이유
Google이 8세대 TPU를 훈련용 8t와 추론용 8i로 분리한 이유와 각 칩의 핵심 설계 차이를 소개합니다. 에이전트 시대가 AI 인프라에 요구하는 것이 무엇인지 알 수 있습니다.
Written by

에이전트 4개 켜두고 정오가 되면 탈진하는 이유, 병렬 AI 작업의 인지 한계
AI 에이전트를 병렬로 여러 개 실행할 때 발생하는 인지 부하와 생산성 한계를 구글 엔지니어 Addy Osmani의 분석을 통해 살펴봅니다.
Written by

GLM-5.1, 600번 반복 끝에 6배 성능을 끌어낸 AI 코딩 모델
Z.ai의 GLM-5.1은 600번 반복으로 6배 성능을 낸 AI 코딩 모델. 오래 실행할수록 나아지는 장기 수평선 능력과 MIT 오픈소스 공개 소식을 소개합니다.
Written by

Gemma 4, 스마트폰에서 돌아가는 에이전트 오픈 모델 출시
Google DeepMind가 공개한 Gemma 4는 스마트폰과 라즈베리파이에서 자율 에이전트를 실행하는 오픈 모델 패밀리입니다. Apache 2.0 라이선스로 상업적 활용이 자유롭습니다.
Written by

월 20만원짜리 AI 직원, Perplexity Personal Computer 출시
Perplexity가 Mac Mini 기반 로컬 AI 에이전트 Personal Computer를 출시했습니다. 월 $200에 파일·앱을 직접 조작하는 AI 에이전트를 소개합니다.
Written by

경쟁사 AI 5개를 하나로 묶은 Perplexity Computer, 멀티모델 오케스트레이션 전략
Perplexity가 Claude, Gemini, Grok 등 경쟁사 AI 모델 5개를 하나의 에이전트 시스템으로 묶은 Perplexity Computer를 출시. 모델 특화 분업 전략과 작동 원리를 소개합니다.
Written by

에이전트 AI 도입 실태, 800명 설문이 보여주는 4가지 역설
Docker가 전 세계 805명 설문으로 분석한 에이전트 AI 도입 실태. 높은 도입률 뒤에 숨겨진 MCP 보안 공백, 오케스트레이션 복잡성, 배포 표준 부재를 짚습니다.
Written by

GLM-5 등장, 744B 파라미터 오픈소스 모델이 에이전트 벤치마크 1위
Z.ai가 744B 파라미터 오픈소스 모델 GLM-5를 공개했습니다. DeepSeek 기술을 통합해 에이전트 작업에 특화된 성능을 보여줍니다.
Written by

AI 에이전트는 수학적으로 불가능하다? 업계가 반박하는 이유
AI 에이전트가 수학적으로 불가능하다는 논문과 업계의 반박. 환각 문제를 가드레일로 극복할 수 있을까? AI 에이전트의 현실과 미래를 분석합니다.
Written by

