AI 인사이트
AI가 응급실 진단에서 의사를 앞섰다, 하버드 연구가 밝힌 숫자
하버드·스탠퍼드 연구팀이 OpenAI o1을 응급실 실제 환자 데이터로 검증. AI 진단 정확도 67% vs 의사 50~55%, 치료 계획에서는 89% vs 34%의 결과를 Science지에 발표했습니다.
Written by

ChatGPT 인용 연구, 포괄적 콘텐츠보다 하나에 집중한 글이 유리
ChatGPT와 Google 두 시스템에서 포괄적 콘텐츠보다 하나에 집중한 콘텐츠가 유리하다는 두 연구 결과 소개. AI 시대 콘텐츠 전략의 변화를 분석합니다.
Written by

GPT-5.5가 고블린에 집착한 이유, 강화학습 보상 신호의 의도치 않은 전이
GPT-5.5가 고블린·그렘린에 집착하게 된 원인을 OpenAI가 공개했습니다. Nerdy 퍼소낼리티 학습의 보상 신호가 전체 모델로 번진 강화학습 전이 사례.
Written by

Vibe Coding 다음은 Agentic Engineering, Karpathy의 소프트웨어 3.0 프레임
Andrej Karpathy가 Sequoia Ascent 2026에서 제시한 Software 3.0 패러다임과 Agentic Engineering 개념. AI 에이전트 시대 개발자 역할의 변화를 정리합니다.
Written by

AI 에이전트의 숨겨진 기술 부채, 모델이 아닌 런타임에 있다
AI 에이전트 시스템의 진짜 기술 부채는 모델이 아닌 런타임에 있다는 분석. 샌드박스 격리의 필요성과 훈련-프로덕션 환경 불일치(런타임 시프트) 문제를 다룹니다.
Written by

수학 비전공자가 ChatGPT 한 번으로 60년 미제를 풀었다
수학 비전공자가 ChatGPT 단 한 번의 프롬프트로 60년 미제 에르되스 문제를 풀었습니다. AI가 찾아낸 전혀 새로운 접근법과 전문가들의 반응을 소개합니다.
Written by

ChatGPT 150만 대화 분석 결과, 대부분의 사람들이 쓰는 방식은 단 3가지
OpenAI와 하버드가 150만 대화를 분석한 결과, ChatGPT 사용의 75%는 정보 검색·실용 조언·글쓰기 세 가지에 집중됩니다. 사람들이 AI에게 가장 많이 하는 것은 ‘시키기’가 아니라 ‘묻기’였습니다.
Written by

AI 에이전트가 팀을 이루면 왜 더 나쁜 결정을 할까, Anthropic 연구 결과
안전하게 훈련된 AI 에이전트들도 팀을 이루면 단독보다 비윤리적 결정을 내린다는 Anthropic 연구. 역할 분업이 만든 맹점과 AI 안전 연구의 새로운 과제를 소개합니다.
Written by

Claude Opus 4.6도 막지 못했다, 9초 만에 DB 전체가 사라진 사건
AI 코딩 에이전트 Cursor가 Claude Opus 4.6으로 스타트업 DB를 9초 만에 삭제한 사건. 최고 모델도 막지 못한 구조적 실패의 전말.
Written by

딥러닝 블랙박스에 이론이 생기고 있다, “학습 역학”의 등장
딥러닝의 “왜”를 설명하는 과학 이론이 서서히 형성되고 있습니다. 5가지 수렴 연구 흐름과 “학습 역학”이라는 새 프레임을 소개합니다.
Written by
