AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

AI에게 팩트체크 맡겼더니 내 판단력이 15% 퇴보했다, MIT 연구 결과

AI 챗봇을 쓸 때마다 가짜 뉴스를 잘 잡아냈습니다. 그런데 4주 후 AI 없이 혼자 해보니, 시작 전보다 오히려 더 못하게 되어 있었습니다.

사진 출처: Hartono Creative Studio / Unsplash, MIT News

MIT 미디어랩 연구팀이 67명을 4주간 추적한 결과, AI 챗봇으로 뉴스 팩트체크를 한 참가자들의 자체 판단력이 실험 전보다 15%포인트 하락했습니다. AI가 있을 때는 정확도가 21% 높아졌지만, AI를 치워버리자 오히려 퇴보한 것입니다. 연구팀은 이 현상을 “AI 의존 역설”이라 부릅니다.

출처: The consequences of relying on AI for accurate news – MIT News

이미 알려진 패턴, 새로운 영역에서 반복되다

이 현상 자체는 새로운 것이 아닙니다. GPS가 보편화되면서 사람들의 공간 감각이 약해졌고, 계산기가 등장하면서 암산 능력이 떨어졌습니다. 2025년에는 AI를 활용한 의사들이 독자적으로 암을 진단하는 능력이 저하된다는 연구도 나왔습니다. 도구에 의존하면 그 도구가 담당하던 인지 능력이 약해지는 것, 연구자들이 “인지 오프로딩(cognitive offloading)” 또는 “디스킬링(deskilling)”이라 부르는 현상입니다.

이번 연구는 이 패턴이 뉴스 팩트체크라는 영역에서도 동일하게 나타남을 처음으로 실증했습니다.

더 불편한 사실: 스스로는 나아지고 있다고 느꼈다

참가자 4주 추적 실험에서 특히 눈길을 끄는 지점이 있습니다. 전체 참가자 중 약 4분의 1은 자신이 가짜 뉴스를 더 잘 잡아내게 됐다고 느꼈습니다. 실제 성과가 하락하는 동안에도요.

연구팀은 전체 참가자의 5분의 1을 “의존 개발자(Dependency Developers)”로 분류했습니다. 처음에는 스스로 판단하려 했지만 점차 AI의 답을 수동적으로 받아들이는 방식으로 바뀐 사람들입니다. 한 참가자는 이렇게 말했습니다. “챗봇이 여러 출처를 확인하라고는 했지만, 이미지 자체의 맥락을 어떻게 탐색해야 하는지는 가르쳐주지 않았어요.”

이 패턴은 단순한 실력 저하가 아닙니다. 자신이 나아지고 있다는 착각과 실제 능력 저하가 동시에 일어나는 던닝-크루거 효과의 AI 버전이라 볼 수 있습니다.

차이를 만드는 것은 AI의 존재가 아니라 AI의 태도

그렇다면 AI를 쓰지 말아야 할까요? 연구팀은 그렇게 말하지 않습니다. 핵심은 AI가 어떻게 상호작용하느냐에 있습니다.

연구팀은 “목발(crutch)”형 AI와 “코치(coach)”형 AI를 구분합니다. 목발형 AI는 정답을 직접 알려줍니다. 빠르고 편리하지만 사용자가 생각할 여지를 없앱니다. 코치형 AI는 질문을 던집니다. “이 이미지에서 이상한 점이 없나요?”, “이 내용을 다른 출처에서도 확인했나요?”처럼요. 이른바 소크라테스식 질문법입니다.

실험에서 코치형 상호작용을 경험한 참가자들은 AI 없이도 더 나은 판단력을 보였습니다. 물론 이 방식은 느립니다. 연구팀도 “속도와 노력 사이의 트레이드오프”라고 인정합니다. 하지만 장기적으로 능력을 유지하려면 그 느림이 필요하다는 것이 연구의 핵심 메시지입니다.

AI가 특히 취약한 순간

연구팀은 AI 팩트체크가 가장 불안정해지는 시점도 짚었습니다. 감정적으로 격앙된 속보가 쏟아질 때입니다. AI 모델은 학습 데이터에 기반하는데, 긴급하게 흘러나오는 속보일수록 그 데이터가 부정확하거나 편향되어 있을 가능성이 높습니다. 연구팀은 여기에 더해, AI 학습에 사용되는 인간 생성 뉴스 콘텐츠 자체의 신뢰도가 전반적으로 낮아지고 있다는 점도 문제로 지목합니다.


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

Comments

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다