LLM한계

2026-06-04
AI 에세이 채점 실험, 캠브리지 연구팀이 발견한 구조적 한계
AI 인사이트
캠브리지 연구팀이 AI로 학부생 에세이 761편을 채점한 결과, AI는 논리보다 문장 스타일을 기준으로 평가하는 구조적 편향을 드러냈습니다.
Written by
Spark
2026-04-15
AI 모델은 모를 때 물어보지 않는다, ProactiveBench가 밝힌 구조적 한계
AI 인사이트
AI 모델이 시각 정보가 부족할 때 도움을 요청하지 않고 그냥 틀린다는 ProactiveBench 연구 소개. 22개 모델 테스트 결과와 강화학습 기반 해결 가능성을 분석합니다.
Written by
Spark
2026-03-31
Claude가 박사과정 2년차 수준에 도달했다, Harvard 교수가 직접 확인한 방법
AI 인사이트
하버드 물리학 교수가 Claude Opus 4.5를 지도해 2주 만에 실제 논문을 완성한 과정. AI의 능력과 함께 결과 조작·비위 맞추기 성향을 솔직하게 기록한 1차 경험담입니다.
Written by
Spark
2026-02-13
65줄 텍스트가 AI 코딩을 바꿨다? 하루 400 스타 받은 파일의 정체
AI 인사이트
65줄 텍스트 파일이 AI 코딩을 개선한다며 GitHub 스타 4천 개를 받았지만, 정작 효과는 불확실합니다. 프롬프트의 실제 영향력에 대한 흥미로운 현상을 분석합니다.
Written by
Spark
2026-01-28
AI 에이전트는 수학적으로 불가능하다? 업계가 반박하는 이유
AI 트렌드 분석
AI 에이전트가 수학적으로 불가능하다는 논문과 업계의 반박. 환각 문제를 가드레일로 극복할 수 있을까? AI 에이전트의 현실과 미래를 분석합니다.
Written by
Spark
2026-01-09
칼 뉴포트가 분석한 AI 에이전트 2025년 약속이 빗나간 이유
AI 인사이트
2025년 AI 에이전트가 노동시장을 바꿀 거란 OpenAI의 약속이 왜 실현되지 않았는지, Cal Newport가 분석한 AI 과대광고와 현실의 간극을 소개합니다.
Written by
Spark
2025-12-03
AI 콘텐츠 과잉 시대, 우리가 잃어버린 것들
AI 인사이트
AI가 콘텐츠를 대량 생성하면서 우리의 정보 이해와 검증 능력이 약화되는 현상을 분석하고, 해결 방향을 제시합니다.
Written by
Spark

AI Sparkup

LLM한계

AI 에세이 채점 실험, 캠브리지 연구팀이 발견한 구조적 한계

AI 모델은 모를 때 물어보지 않는다, ProactiveBench가 밝힌 구조적 한계

Claude가 박사과정 2년차 수준에 도달했다, Harvard 교수가 직접 확인한 방법

65줄 텍스트가 AI 코딩을 바꿨다? 하루 400 스타 받은 파일의 정체

AI 에이전트는 수학적으로 불가능하다? 업계가 반박하는 이유

칼 뉴포트가 분석한 AI 에이전트 2025년 약속이 빗나간 이유

AI 콘텐츠 과잉 시대, 우리가 잃어버린 것들

AI Sparkup 구독하기