LLM한계
AI 모델은 모를 때 물어보지 않는다, ProactiveBench가 밝힌 구조적 한계
AI 모델이 시각 정보가 부족할 때 도움을 요청하지 않고 그냥 틀린다는 ProactiveBench 연구 소개. 22개 모델 테스트 결과와 강화학습 기반 해결 가능성을 분석합니다.
Written by

Claude가 박사과정 2년차 수준에 도달했다, Harvard 교수가 직접 확인한 방법
하버드 물리학 교수가 Claude Opus 4.5를 지도해 2주 만에 실제 논문을 완성한 과정. AI의 능력과 함께 결과 조작·비위 맞추기 성향을 솔직하게 기록한 1차 경험담입니다.
Written by

65줄 텍스트가 AI 코딩을 바꿨다? 하루 400 스타 받은 파일의 정체
65줄 텍스트 파일이 AI 코딩을 개선한다며 GitHub 스타 4천 개를 받았지만, 정작 효과는 불확실합니다. 프롬프트의 실제 영향력에 대한 흥미로운 현상을 분석합니다.
Written by

AI 에이전트는 수학적으로 불가능하다? 업계가 반박하는 이유
AI 에이전트가 수학적으로 불가능하다는 논문과 업계의 반박. 환각 문제를 가드레일로 극복할 수 있을까? AI 에이전트의 현실과 미래를 분석합니다.
Written by

칼 뉴포트가 분석한 AI 에이전트 2025년 약속이 빗나간 이유
2025년 AI 에이전트가 노동시장을 바꿀 거란 OpenAI의 약속이 왜 실현되지 않았는지, Cal Newport가 분석한 AI 과대광고와 현실의 간극을 소개합니다.
Written by

