GPT-5 출시의 명과 암: 기대와 현실 사이에서 드러난 AI의 진짜 모습

2025-08-12

﹒

3 minutes

GPT-5가 출시되었지만 사용자들은 실망을 넘어 분노하고 있습니다. ‘PhD 수준 전문가’라고 자신했던 OpenAI의 새 모델이 오히려 퇴보했다는 평가를 받으며 AI 업계의 과대광고 문화에 대한 근본적 의문을 던지고 있습니다.

화려한 예고와 싸늘한 현실

OpenAI의 샘 알트만 CEO는 GPT-5 출시 전 스타워즈 로그 원의 데스 스타 장면을 X(구 트위터)에 올리며 자신감을 드러냈습니다. 그는 라이브스트림에서 “GPT-5와 대화하는 것은 진정한 PhD 수준 전문가와 이야기하는 것 같다”고 자랑했습니다.

하지만 현실은 달랐습니다. 출시 직후 Reddit에 “GPT-5는 끔찍하다”는 제목의 글이 올라왔고 4,000개가 넘는 댓글이 달렸습니다. 사용자들은 새 모델이 이전 버전보다 못하다고 입을 모았습니다.

GPT-5 출시 후 소셜미디어에서 쏟아진 부정적 반응들 (출처: Horizon AI)

구체적인 문제점들이 드러나다

사용자들이 지적한 문제는 단순한 불만이 아니었습니다. 구체적인 성능 지표에서도 문제가 나타났습니다.

성능 벤치마크의 충격

SimpleBench에서 GPT-5는 56.7%라는 저조한 점수를 기록했습니다
이는 Gemini 2.5 Pro, Grok 4, Claude 4.1 Opus보다 낮은 수준입니다
일상적인 상식과 추론 능력을 측정하는 이 테스트에서 5위에 그쳤습니다

사용자 경험의 악화
사용자들은 GPT-5가 이전 모델들에 비해 창의성과 감정적 뉘앙스가 부족하다고 평가했습니다. 특히 유료 구독자들은 모델 선택권이 사라진 것에 대해 강하게 반발했습니다.

한 마케팅 전문가는 “몇 달간 OpenAI의 한계를 극복하기 위한 시스템을 구축했는데, 24시간도 안 되어 쓸모없게 되었다”고 토로했습니다.

OpenAI의 긴급 대응

사용자들의 거센 반발에 직면한 샘 알트만은 즉시 공개 사과에 나섰습니다. 그는 X에서 상황을 인정하고 Reddit AMA까지 참여하며 적극적인 소통에 나섰습니다.

구체적인 개선 조치

GPT-4o와 기존 모델들에 대한 접근 권한 복원
Plus 사용자를 위한 GPT-5 사용 한도 2배 확대
사고 과정을 수동으로 실행할 수 있는 UI 개선
어떤 모델이 작동 중인지 명확히 표시하는 기능 추가

알트만은 “사용자들이 GPT-4o의 특성을 얼마나 소중히 여기는지 과소평가했다”며 “앞으로 더 많은 피드백을 듣고 투명성을 높이겠다”고 약속했습니다.

GPT-5 출시 후 실망한 ChatGPT 사용자들 (출처: WIRED)

더 깊은 구조적 문제들

AI 회의론자인 게리 마커스 교수는 이번 사태를 더 근본적인 관점에서 분석했습니다. 그는 GPT-5가 여전히 체스 규칙을 제대로 따르지 못하고 이미지 인식에서 기본적인 실수를 범한다고 지적했습니다.

기술적 한계의 지속

자전거 부품 개수를 잘못 세는 등 시각적 이해력 부족
체스 게임에서 규칙 위반을 반복하는 논리적 추론 한계
아리조나주립대 연구에 따르면 LLM의 일반화 능력 한계가 여전히 존재

마커스 교수는 “순수한 스케일링만으로는 AGI에 도달할 수 없다는 것이 다시 한 번 증명되었다”며 “뉴로심볼릭 AI와 명시적 세계 모델이 필요하다”고 주장했습니다.

AI 업계에 던지는 메시지

이번 GPT-5 논란은 AI 업계 전반에 중요한 시사점을 던집니다.

과대광고의 역효과
OpenAI는 몇 달간 GPT-5에 대한 기대감을 높였습니다. 하지만 실제 성능이 기대에 못 미치자 실망감은 더욱 커졌습니다. 폴리마켓의 여론조사에서 OpenAI가 최고 AI 모델을 보유할 것이라는 예측이 75%에서 14%로 급락한 것이 이를 보여줍니다.

사용자 중심 개발의 중요성
사용자들은 단순히 더 강력한 모델을 원하는 것이 아닙니다. 자신의 작업 방식에 맞는 도구를 원합니다. 창작 작업을 하는 사용자에게는 창의성이, 분석 작업을 하는 사용자에게는 정확성이 더 중요할 수 있습니다.

투명한 소통의 필요성
OpenAI는 모델 변경 사항을 미리 공지하지 않아 사용자들을 당황시켰습니다. API 사용자들에게는 사전 공지를 하면서 일반 사용자들에게는 하지 않은 것은 형평성 문제를 제기합니다.

GPT-5 출시 전 샘 알트만이 올린 스타워즈 데스 스타 이미지. 아이러니하게도 로그 원에서 데스 스타는 파괴된다 (출처: Gary Marcus Substack)

현실적 기대치 설정이 답이다

GPT-5 논란은 AI 기술 발전에 대한 우리의 접근 방식을 재검토할 기회를 제공합니다.

AI는 분명 유용한 도구입니다. 하지만 만능 해결책은 아닙니다. 각 모델마다 장단점이 있고, 사용자마다 필요한 기능이 다릅니다.

중요한 것은 혁신적인 발전보다는 안정적이고 예측 가능한 개선입니다. 사용자들이 자신의 워크플로우를 믿고 구축할 수 있는 플랫폼을 만드는 것이 더 가치 있을 수 있습니다.

이번 사태를 통해 AI 업계는 기술 중심이 아닌 사용자 중심의 개발 철학으로 전환해야 한다는 교훈을 얻었습니다. 화려한 마케팅보다는 실질적인 가치 제공이, 급진적 변화보다는 점진적 개선이 더 중요할 때입니다.

참고자료:

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

GPT-5 출시의 명과 암: 기대와 현실 사이에서 드러난 AI의 진짜 모습

화려한 예고와 싸늘한 현실

구체적인 문제점들이 드러나다

OpenAI의 긴급 대응

더 깊은 구조적 문제들

AI 업계에 던지는 메시지

현실적 기대치 설정이 답이다

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

해커 없이 DB를 지운 AI 에이전트, 왜 이런 사고가 날까

모델 만들던 데이터 사이언티스트, 이제 에이전트를 관리한다

에이전트 자율성 6단계와 살아남는 커리어의 조건

AI의 속마음을 읽는 J-space, Claude 안에서 스스로 생겨났다