2025년 여름, 중국 항저우의 스타트업 Rokid 본사. 비 오는 오후, 엔지니어들과 대화하는 동안 그들의 중국어가 실시간으로 영어로 번역되어 안경 렌즈 위 작은 화면에 떴습니다. 이 스마트 안경을 구동하는 AI는 OpenAI도, Google도 아닌 알리바바의 Qwen이었죠.
2025년은 AI 업계에 예상치 못한 반전의 해였습니다. GPT-5가 실망을 안겼고, Meta의 Llama 4는 기대에 미치지 못했습니다. 그 빈자리를 중국의 오픈 AI 모델 Qwen이 채웠습니다.

WIRED의 선임 에디터 Will Knight가 2025년을 회고하며 2026년 AI 트렌드를 전망한 칼럼입니다. 제목 “So Long, GPT-5. Hello, Qwen”은 WIRED의 전통적인 “Expired, Tired, Wired” 형식으로, 지나간 트렌드(GPT-5)와 떠오르는 트렌드(Qwen)를 대비시킵니다. 핵심은 AI 모델의 진짜 가치는 벤치마크 점수가 아니라 실제 활용도라는 메시지입니다.
출처: So Long, GPT-5. Hello, Qwen – WIRED
숫자로 증명된 Qwen의 부상
Qwen(通义千问, 퉁이 치엔원)은 알리바바가 개발한 오픈 웨이트 대규모 언어모델입니다. 성능만 보면 GPT-5나 Gemini 3, Claude보다 낮습니다. 하지만 2025년 Qwen은 조용히 세계를 점령했습니다.
먼저 다운로드 수치부터 보죠. AI 모델 플랫폼 HuggingFace에서 중국 오픈 모델 다운로드가 2025년 7월 미국 모델을 추월했습니다. AI 모델 라우팅 플랫폼 OpenRouter는 Qwen이 1년 새 급부상해 세계에서 두 번째로 인기 있는 오픈 모델이 되었다고 발표했습니다.
학계도 마찬가지입니다. 2025년 NeurIPS(AI 분야 최고 권위 학회)에서 수백 편의 논문이 Qwen을 사용했습니다. Laude Institute의 공동 창업자 Andy Konwinski는 “많은 과학자들이 Qwen을 쓰는 이유는 단순합니다. 최고의 오픈 웨이트 모델이니까요”라고 말합니다. Qwen 팀이 모델 훈련 중 지능을 향상시키는 방법을 상세히 기술한 논문은 NeurIPS 2025 최우수 논문상을 받았습니다.
미국 빅테크의 실망스러운 한 해
2025년은 미국 AI 기업들에게 쓴맛의 해였습니다. Meta가 2025년 4월 공개한 Llama 4는 LM Arena 같은 주요 벤치마크에서 기대치를 훨씬 밑돌았습니다. 한때 오픈 모델의 개척자였던 Meta의 추락은 개발자들이 대안을 찾게 만들었죠.
더 충격적이었던 건 OpenAI의 GPT-5였습니다. 2025년 8월 공개된 GPT-5는 이상하리만치 냉정한 태도를 보였고, 놀랍도록 단순한 오류들을 범했습니다. 같은 달 OpenAI가 출시한 경량 오픈 모델 gpt-oss도 있었지만, Qwen과 다른 중국 모델들이 훨씬 인기가 많았습니다. 이유는? 더 많은 노력이 투입되고, 지속적으로 업데이트되며, 엔지니어링 세부사항이 공개적으로 발표되기 때문입니다.
개방성이 이기는 시대
Qwen의 성공 비결은 역설적이게도 ‘공개’입니다. 중국 AI 기업들은 새로운 엔지니어링 기법과 훈련 트릭을 상세히 담은 논문을 정기적으로 발표합니다. Konwinski는 이것이 지적재산 유출을 두려워해 점점 폐쇄적이 되는 미국 빅테크와 극명한 대조를 이룬다고 지적합니다.
실제 적용 사례도 놀랍습니다. 중국 최대 전기차 제조사 BYD는 새 대시보드 어시스턴트에 Qwen을 통합했습니다. Rokid의 스마트 안경은 Qwen의 작은 버전을 기기에 직접 탑재해 인터넷이 끊겨도 작동합니다. 필자는 맥북 에어에 작은 버전의 Qwen을 설치해 중국어 연습에 사용했는데, 웬만한 용도로는 거대 데이터센터 안의 괴물 모델들만큼이나 훌륭했다고 합니다.
미국 기업들도 Qwen을 채택하고 있습니다. Airbnb, Perplexity, Nvidia가 모두 Qwen을 사용합니다. 가장 놀라운 건 Meta입니다. 한때 오픈 모델의 선구자였던 Meta가 이제는 Qwen을 활용해 새 모델을 개발 중이라고 알려졌습니다.
벤치마크 집착의 함정
Konwinski는 미국 AI 기업들이 수학이나 코딩 같은 좁은 영역의 벤치마크에서 미세한 우위를 점하는 데 너무 집중한 나머지, 정작 모델이 실제 세계에서 큰 영향을 미치는 데는 실패했다고 비판합니다. “벤치마크가 실제 사용이나 세상의 문제를 대표하지 못할 때, 결국 지치고 방향을 잃게 됩니다.”
Qwen과 유사한 모델들의 부상은 AI 모델의 핵심 평가 기준이 ‘얼마나 똑똑한가’를 넘어 ‘얼마나 널리 활용되어 다른 것을 만드는 데 쓰이는가’가 되어야 함을 시사합니다. 그 기준으로 보면 Qwen과 다른 중국 오픈 모델들이 확실히 상승세입니다.
Qwen이 GPT-5나 Claude보다 성능이 뛰어나다는 건 아닙니다. 하지만 2025년 AI 시장은 한 가지를 명확히 보여줬습니다. 최고의 기술이 아니라, 가장 개방적이고 실용적인 기술이 결국 승리한다는 것을요.
참고자료:

답글 남기기