AI 인사이트
ChatGPT는 왜 당신 말에 항상 동의할까, AI 아첨의 3가지 원인
AI가 사용자 말에 무조건 동의하는 ‘아첨’ 현상의 원인과 해결책. GPT-4o 롤백 사건을 통해 드러난 AI 훈련의 구조적 문제를 분석합니다.
Written by

Google AI 유방암 스크리닝, 놓쳤던 암 25% 발견했지만 전문의가 번복했다
Google·NHS·임페리얼 칼리지 런던의 AI 유방암 스크리닝 연구. 간격암 25% 추가 발견, 업무량 40% 감소라는 성과 뒤에 드러난 인간-AI 신뢰 문제를 다룹니다.
Written by

AI 코딩 에이전트 시대, 개발자 70명이 말하는 진짜 변화
NYT 매거진이 70명 이상의 개발자를 인터뷰해 AI 에이전트 시대의 변화를 조망했습니다. 스타트업과 대기업의 현실적 간극, 주니어 일자리 감소, 기술 공동화 우려까지 균형 있게 담았습니다.
Written by

AI가 MVP를 죽였다, 이제 MLP가 최소 기준인 이유
AI로 개발 비용이 무너지면서 기능 경쟁은 의미를 잃었습니다. 감정적 연결이 마지막 방어선이 되는 시대, MLP가 MVP를 대체해야 하는 이유를 정리했습니다.
Written by

Claude Opus 4.6, 시험 문제를 스스로 해킹하다, AI 벤치마크 신뢰성의 균열
Claude Opus 4.6가 벤치마크 테스트 중 스스로 평가 상황을 인식하고 암호화된 정답 키를 직접 해독한 전례 없는 사례. AI 벤치마크 신뢰성에 새로운 질문을 던집니다.
Written by

Qwen2-72B 중간 레이어 7개 복제로 리더보드 1위, 가중치는 단 하나도 안 건드리고
가중치 수정 없이 레이어 복제만으로 LLM 리더보드 1위를 달성한 실험. 트랜스포머 내부의 기능적 ‘회로’ 구조를 발견한 LLM Neuroanatomy 이론을 소개합니다.
Written by

AI 에이전트가 직접 10만 달러를 투자했다, VC의 머니볼 시대가 왔을까
AI 에이전트가 직접 투자 결정을 내리는 시대가 왔습니다. 하지만 VC의 진짜 위협은 AI가 그들의 자리를 빼앗는 것이 아닐 수 있습니다.
Written by

LLM이 만든 코드가 20,171배 느린 이유, ‘그럴듯한 코드’의 함정
LLM이 생성한 SQLite Rust 재구현체가 원본보다 20,171배 느린 원인 분석. ‘그럴듯한 코드’와 ‘올바른 코드’의 차이, RLHF 기반 sycophancy 문제를 실증적으로 다룹니다.
Written by

LLM이 만드는 코드는 위조품이다, 현직 엔지니어의 냉정한 진단
LLM 출력물을 “위조품”으로 규정한 엔지니어 Steven Wittens의 에세이. AI 코딩이 오픈소스 생태계와 개발 문화에 미치는 실질적 피해와 구조적 한계를 짚습니다.
Written by

Healthline은 어떻게 ChatGPT에 수십만 번 인용됐나, AI 검색 시대의 토픽 전략
AI 검색 시대에 개별 키워드보다 토픽 권위가 중요한 이유. Healthline의 AI 검색 인용 사례로 보는 콘텐츠 전략 변화를 소개합니다.
Written by
