Archive
AI 에이전트에게 기억을 더 줄수록 오히려 멍청해진다, PlugMem이 찾은 해법
AI 에이전트에 메모리를 더 줄수록 성능이 떨어지는 역설을 해결한 Microsoft Research의 PlugMem 연구. 인지과학 기반 지식 중심 메모리 구조를 소개합니다.
Written by

ATM은 은행 텔러를 살렸지만 아이폰은 없앴다, AI 일자리 논쟁이 놓친 것
ATM은 텔러를 살렸지만 아이폰이 없앴다. 작업 자동화와 패러다임 교체의 차이, AI 일자리 논쟁에 던지는 핵심 질문.
Written by

SWE-bench 통과한 AI 코드, 실제 개발자에겐 절반이 불합격
METR 연구 결과, AI가 SWE-bench를 통과한 코드의 절반이 실제 개발자 심사에서 탈락했습니다. 벤치마크 점수와 실무 유용성 사이의 격차를 분석합니다.
Written by

Mistral Small 4, 추론·멀티모달·코딩을 하나로 합친 119B 오픈소스 모델
Mistral AI가 추론·멀티모달·코딩 에이전트 기능을 통합한 119B 오픈소스 모델 Mistral Small 4를 공개했습니다. MoE 아키텍처로 효율을 유지하면서 다목적 활용이 가능한 모델입니다.
Written by

Gemini API 비용 관리, 이제 직접 한도를 설정할 수 있습니다
Google이 Gemini API에 프로젝트별 월 지출 한도 설정과 자동 티어 업그레이드 기능을 공개했습니다. AI 앱 비용 관리가 쉬워집니다.
Written by

AI 에이전트로 검색 품질 6-10% 올린 실험, ML 팀 없이도 가능하다
ML 팀 없이 AI 에이전트 하나로 검색 품질을 6-10% 개선한 실험. 에이전틱 검색의 작동 방식, 실패 패턴, 지연 시간 트레이드오프를 소개합니다.
Written by

OpenClaw 열풍이 보여주는 AI 에이전트의 다음 단계
하루 만에 GitHub 스타 2.5만 개를 달성한 AI 에이전트 OpenClaw. 단순한 아키텍처가 성숙한 LLM과 만났을 때 무엇이 달라지는지, 그리고 에이전트 시대의 보안 문제를 분석합니다.
Written by

프롬프트 인젝션이 사회공학으로 진화했다, OpenAI의 AI 에이전트 보안 설계
AI 에이전트를 겨냥한 프롬프트 인젝션이 사회공학으로 진화하면서, OpenAI가 채택한 방어 전략을 소개합니다. 완벽한 차단 대신 피해를 구조적으로 제한하는 설계 원칙이 핵심입니다.
Written by

AI 연구자 Mollick의 현재 진단, 지금이 형태를 결정할 마지막 창문
Wharton 교수 Ethan Mollick의 AI 현황 진단. 지수적 성장, 소프트웨어 팩토리 실험, 2월 혼돈의 한 주를 통해 “지금이 AI 형태를 결정할 창문”임을 짚습니다.
Written by

