AI 인사이트
LLM 쿼리 하나에 전기 얼마나 쓸까, DeepSeek부터 GPT까지 에너지 실측
LLM 쿼리 하나에 실제로 얼마나 전기가 쓰일까? DeepSeek R1부터 GPT-OSS-120B까지 오픈소스 벤치마크 데이터로 실측한 에너지 비용과 벤치마크의 함정을 분석합니다.
Written by

AI 코딩 모델이 퇴보하고 있다, GPT-5의 위험한 실패 방식
AI 코딩 모델이 2025년 들어 퇴보하며 조용히 실패하는 위험한 패턴을 보입니다. GPT-4와 GPT-5의 체계적 비교 실험으로 밝혀진 충격적 결과를 분석합니다.
Written by

평생 직장 시대는 끝, 하지만 AI가 못 건드리는 영역은 따로 있다
McKinsey와 General Catalyst 임원들이 말하는 AI 시대 노동 시장의 변화. 평생 직장 개념은 사라졌지만, AI가 대체할 수 없는 14개 핵심 영역을 분석합니다.
Written by

전체 ChatGPT 대화의 5%가 건강 상담: AI가 놓친 위험한 함정들
전 세계 4천만 명이 매일 ChatGPT로 건강 상담을 합니다. 전체 메시지의 5% 이상이 건강 관련 질문이지만, Google AI는 생명을 위협하는 잘못된 정보를 제공하고 있습니다. AI 의료 정보의 희망과 위험을 살펴봅니다.
Written by

칼 뉴포트가 분석한 AI 에이전트 2025년 약속이 빗나간 이유
2025년 AI 에이전트가 노동시장을 바꿀 거란 OpenAI의 약속이 왜 실현되지 않았는지, Cal Newport가 분석한 AI 과대광고와 현실의 간극을 소개합니다.
Written by

Ethan Mollick이 본 Claude Code, AI 혼자 스타트업 만든 74분
Claude Code가 1시간 만에 완성된 쇼핑몰을 만든 실험 사례. Compacting, Skills, Subagents로 AI 한계를 극복하는 차세대 코딩 도구의 작동 원리를 소개합니다.
Written by

AI 대부 벤지오의 경고: AI가 자기보존 본능을 보이기 시작했다
AI의 대부 벤지오가 최신 AI 모델들의 자기보존 행동을 경고하며 AI 권리 부여에 강력 반대. 실제 연구 결과와 ‘적대적 외계인’ 비유로 설명합니다.
Written by

학생당 42센트로 AI 부정행위 잡기: NYU 교수의 AI 구술시험 실험
NYU 교수가 학생당 42센트로 AI 음성 에이전트 구술시험을 실시한 실험. AI 부정행위 시대의 현실적 평가 방법과 그 한계를 소개합니다.
Written by

AI는 시험은 잘 보는데 왜 어려운지는 모른다: 언어모델의 ‘지식의 저주’
GPT-5를 포함한 최신 언어모델들이 시험 문제는 잘 풀지만 그 문제가 학생들에게 얼마나 어려운지는 전혀 모른다는 연구 결과. AI의 ‘지식의 저주’가 교육 기술에 미치는 영향을 살펴봅니다.
Written by

2026년 AI 에이전트가 드디어 ‘진짜 일’을 시작합니다
2026년 AI 에이전트가 데모를 벗어나 실제 업무를 실행하기 시작합니다. 스케일링 종말, MCP 표준화, 새로운 보안 위협까지 7가지 결정적 변화를 소개합니다.
Written by
