AI Sparkup

복잡한 AI 세상을 읽는 힘 ⚡

GPT-5 출시의 명과 암: 기대와 현실 사이에서 드러난 AI의 진짜 모습

GPT-5가 출시되었지만 사용자들은 실망을 넘어 분노하고 있습니다. ‘PhD 수준 전문가’라고 자신했던 OpenAI의 새 모델이 오히려 퇴보했다는 평가를 받으며 AI 업계의 과대광고 문화에 대한 근본적 의문을 던지고 있습니다.

화려한 예고와 싸늘한 현실

OpenAI의 샘 알트만 CEO는 GPT-5 출시 전 스타워즈 로그 원의 데스 스타 장면을 X(구 트위터)에 올리며 자신감을 드러냈습니다. 그는 라이브스트림에서 “GPT-5와 대화하는 것은 진정한 PhD 수준 전문가와 이야기하는 것 같다”고 자랑했습니다.

하지만 현실은 달랐습니다. 출시 직후 Reddit에 “GPT-5는 끔찍하다”는 제목의 글이 올라왔고 4,000개가 넘는 댓글이 달렸습니다. 사용자들은 새 모델이 이전 버전보다 못하다고 입을 모았습니다.

GPT-5 출시 후 사용자 반응
GPT-5 출시 후 소셜미디어에서 쏟아진 부정적 반응들 (출처: Horizon AI)

구체적인 문제점들이 드러나다

사용자들이 지적한 문제는 단순한 불만이 아니었습니다. 구체적인 성능 지표에서도 문제가 나타났습니다.

성능 벤치마크의 충격

  • SimpleBench에서 GPT-5는 56.7%라는 저조한 점수를 기록했습니다
  • 이는 Gemini 2.5 Pro, Grok 4, Claude 4.1 Opus보다 낮은 수준입니다
  • 일상적인 상식과 추론 능력을 측정하는 이 테스트에서 5위에 그쳤습니다

사용자 경험의 악화
사용자들은 GPT-5가 이전 모델들에 비해 창의성과 감정적 뉘앙스가 부족하다고 평가했습니다. 특히 유료 구독자들은 모델 선택권이 사라진 것에 대해 강하게 반발했습니다.

한 마케팅 전문가는 “몇 달간 OpenAI의 한계를 극복하기 위한 시스템을 구축했는데, 24시간도 안 되어 쓸모없게 되었다”고 토로했습니다.

OpenAI의 긴급 대응

사용자들의 거센 반발에 직면한 샘 알트만은 즉시 공개 사과에 나섰습니다. 그는 X에서 상황을 인정하고 Reddit AMA까지 참여하며 적극적인 소통에 나섰습니다.

구체적인 개선 조치

  • GPT-4o와 기존 모델들에 대한 접근 권한 복원
  • Plus 사용자를 위한 GPT-5 사용 한도 2배 확대
  • 사고 과정을 수동으로 실행할 수 있는 UI 개선
  • 어떤 모델이 작동 중인지 명확히 표시하는 기능 추가

알트만은 “사용자들이 GPT-4o의 특성을 얼마나 소중히 여기는지 과소평가했다”며 “앞으로 더 많은 피드백을 듣고 투명성을 높이겠다”고 약속했습니다.

ChatGPT 사용자들의 반응
GPT-5 출시 후 실망한 ChatGPT 사용자들 (출처: WIRED)

더 깊은 구조적 문제들

AI 회의론자인 게리 마커스 교수는 이번 사태를 더 근본적인 관점에서 분석했습니다. 그는 GPT-5가 여전히 체스 규칙을 제대로 따르지 못하고 이미지 인식에서 기본적인 실수를 범한다고 지적했습니다.

기술적 한계의 지속

  • 자전거 부품 개수를 잘못 세는 등 시각적 이해력 부족
  • 체스 게임에서 규칙 위반을 반복하는 논리적 추론 한계
  • 아리조나주립대 연구에 따르면 LLM의 일반화 능력 한계가 여전히 존재

마커스 교수는 “순수한 스케일링만으로는 AGI에 도달할 수 없다는 것이 다시 한 번 증명되었다”며 “뉴로심볼릭 AI와 명시적 세계 모델이 필요하다”고 주장했습니다.

AI 업계에 던지는 메시지

이번 GPT-5 논란은 AI 업계 전반에 중요한 시사점을 던집니다.

과대광고의 역효과
OpenAI는 몇 달간 GPT-5에 대한 기대감을 높였습니다. 하지만 실제 성능이 기대에 못 미치자 실망감은 더욱 커졌습니다. 폴리마켓의 여론조사에서 OpenAI가 최고 AI 모델을 보유할 것이라는 예측이 75%에서 14%로 급락한 것이 이를 보여줍니다.

사용자 중심 개발의 중요성
사용자들은 단순히 더 강력한 모델을 원하는 것이 아닙니다. 자신의 작업 방식에 맞는 도구를 원합니다. 창작 작업을 하는 사용자에게는 창의성이, 분석 작업을 하는 사용자에게는 정확성이 더 중요할 수 있습니다.

투명한 소통의 필요성
OpenAI는 모델 변경 사항을 미리 공지하지 않아 사용자들을 당황시켰습니다. API 사용자들에게는 사전 공지를 하면서 일반 사용자들에게는 하지 않은 것은 형평성 문제를 제기합니다.

샘 알트만의 데스 스타 트윗
GPT-5 출시 전 샘 알트만이 올린 스타워즈 데스 스타 이미지. 아이러니하게도 로그 원에서 데스 스타는 파괴된다 (출처: Gary Marcus Substack)

현실적 기대치 설정이 답이다

GPT-5 논란은 AI 기술 발전에 대한 우리의 접근 방식을 재검토할 기회를 제공합니다.

AI는 분명 유용한 도구입니다. 하지만 만능 해결책은 아닙니다. 각 모델마다 장단점이 있고, 사용자마다 필요한 기능이 다릅니다.

중요한 것은 혁신적인 발전보다는 안정적이고 예측 가능한 개선입니다. 사용자들이 자신의 워크플로우를 믿고 구축할 수 있는 플랫폼을 만드는 것이 더 가치 있을 수 있습니다.

이번 사태를 통해 AI 업계는 기술 중심이 아닌 사용자 중심의 개발 철학으로 전환해야 한다는 교훈을 얻었습니다. 화려한 마케팅보다는 실질적인 가치 제공이, 급진적 변화보다는 점진적 개선이 더 중요할 때입니다.


참고자료:


AI Sparkup 구독하기

구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

Comments