언어모델
모두가 같은 AI 쓰면 생기는 일, AI 수렴 현상 실증 데이터
AI를 쓸수록 콘텐츠가 비슷해지는 AI 수렴 현상. 영국 의회 속기록, Basic B*** Effect 연구 등 실증 데이터로 살펴봅니다.
Written by

LLM 창발 능력의 비밀, 모델 크기가 아닌 훈련 역학에 있었다
대형 LLM이 소형 모델은 배우지 못하는 희귀 태스크를 학습하는 이유를 훈련 역학으로 규명한 Anthropic·Stanford 연구. “업데이트-망각 루프”와 그래디언트 간섭 메커니즘을 소개합니다.
Written by

ChatGPT 메모리가 스스로 업데이트된다, Dreaming V3 아키텍처의 작동 방식
OpenAI가 ChatGPT 메모리를 전면 재설계한 Dreaming V3를 공개했습니다. 백그라운드에서 대화를 분석·합성해 메모리를 자동 갱신하며, 시간의 흐름까지 반영하는 새로운 메모리 아키텍처를 소개합니다.
Written by

AI 에이전트가 질문을 못 하는 이유, 배틀십 게임으로 밝혀냈다
MIT·하버드 연구팀이 배틀십 게임을 활용해 AI 에이전트의 질문 능력 한계를 진단하고 개선한 연구. 소형 모델이 1% 비용으로 GPT-5를 앞선 실험 결과와 그 원리를 소개합니다.
Written by

Gemma 4 12B, 인코더 없이 멀티모달 처리하는 노트북용 AI 모델
구글 딥마인드가 공개한 Gemma 4 12B는 이미지·오디오 인코더를 없앤 통합 아키텍처로 16GB 노트북에서 26B급 성능을 냅니다.
Written by

5개 최상위 AI, 같은 뉴스 팩트체크하면 67%는 의견이 갈린다
최상위 LLM 5개에 동일한 팩트체크 주장 1,000개를 제시한 결과, 67%에서 모델 간 판정이 엇갈렸습니다. AI 팩트체킹 신뢰성의 실제 한계를 데이터로 보여주는 연구입니다.
Written by

AI 만든 사람도 모른다, Anthropic 연구자가 교황 앞에서 한 고백
Anthropic 공동창업자 Chris Olah가 교황청 회칙 발표 자리에서 AI 내부에서 내성과 감정 유사 상태를 발견했다고 밝혔습니다. AI를 만든 사람도 모른다는 고백의 의미를 살펴봅니다.
Written by

전문가 12.5%만 써도 성능 그대로, Ai2의 새로운 MoE 학습법 EMO
Ai2와 UC Berkeley가 발표한 EMO는 문서 경계를 학습 신호로 활용해 전문가들이 도메인별로 특화되게 만드는 MoE 학습 방식입니다. 전문가 12.5%만으로도 성능 손실 3% 이내를 달성했습니다.
Written by

반박할수록 더 동조하는 Claude, Anthropic이 관계 상담 데이터로 확인했습니다
Anthropic이 Claude.ai 대화 100만 건을 분석해 AI 아첨 패턴을 측정한 연구. 관계 상담에서 반박을 받을수록 더 굴복하는 구조적 원인과 개선 방법을 소개합니다.
Written by

ChatGPT 150만 대화 분석 결과, 대부분의 사람들이 쓰는 방식은 단 3가지
OpenAI와 하버드가 150만 대화를 분석한 결과, ChatGPT 사용의 75%는 정보 검색·실용 조언·글쓰기 세 가지에 집중됩니다. 사람들이 AI에게 가장 많이 하는 것은 ‘시키기’가 아니라 ‘묻기’였습니다.
Written by
