중국의 AI 스타트업 Z.ai가 출시한 GLM-4.5 모델이 Claude 4 Opus, OpenAI o3 등 서구 최고 모델들과 경쟁하거나 능가하는 성능을 보이며 글로벌 AI 패권 구도에 변화를 일으키고 있습니다.

중국 AI의 서구 추격, 이제는 현실
최근 AI 업계에서 가장 주목받는 소식 중 하나는 중국 기업들의 연이은 성과입니다. DeepSeek의 충격적인 등장에 이어, Moonshot AI의 Kimi K2, 그리고 이번 Z.ai의 GLM-4.5까지. 한 AI 엔지니어가 X(트위터)에서 “중국 연구소들이 의자 뺏기 게임을 하고 있는 것 같다”고 표현했을 정도로, 중국발 AI 모델들이 연달아 글로벌 벤치마크 상위권을 차지하고 있습니다.
Z.ai(구 Zhipu AI)는 베이징에 본사를 둔 스타트업으로, 칭화대학교에서 출발해 2019년부터 대규모 언어모델을 개발해왔습니다. 텐센트, 알리바바, 힐하우스 캐피털 등의 투자를 받아 현재 기업가치 28억 달러를 기록하고 있으며, 전 세계 70만 명 이상의 개발자들이 이들의 모델을 사용하고 있습니다.
GLM-4.5의 기술적 특징과 성능
GLM-4.5는 총 3,550억 개의 파라미터를 가진 대형 모델과 320억 개의 활성 파라미터를 사용하는 MoE(Mixture of Experts) 아키텍처로 설계되었습니다. 경량 버전인 GLM-4.5-Air는 1,060억 개의 총 파라미터와 120억 개의 활성 파라미터를 가지고 있어 더 효율적인 온디바이스 배포가 가능합니다.
이 모델들의 가장 큰 특징은 듀얼 모드 시스템입니다. 복잡한 추론이 필요한 수학, 코딩, 논리 문제에는 ‘사고 모드(thinking mode)’를 사용해 심도 있는 분석을 제공하고, 일반적인 대화에는 ‘비사고 모드(non-thinking mode)’로 빠른 응답을 제공합니다.
Z.ai는 또한 강화학습 인프라 ‘slime’을 함께 공개했습니다. 이 시스템은 모델 훈련과 데이터 생성을 분리해 처리 속도를 높였으며, FP8 혼합 정밀도를 사용해 더 빠른 롤아웃을 지원합니다. 한 NLP 과학자는 X에서 GLM-4.5 Air 모델이 FP8 형식에서 “쉽게 초당 200토큰”을 생성할 수 있다고 평가했습니다.
벤치마크에서 증명된 실력
GLM-4.5의 성능은 다양한 벤치마크에서 입증되고 있습니다. Artificial Analysis의 종합 평가에서 GLM-4.5는 전 세계 3위, GLM-4.5-Air는 6위를 기록했습니다. 이는 OpenAI, Anthropic, Google DeepMind, xAI 등 거대 기업들과 어깨를 나란히 하는 수준입니다.

특히 웹 브라우징 작업을 평가하는 BrowseComp 벤치마크에서 GLM-4.5는 26.4%의 정답률을 기록해 Claude-4-Opus(18.8%)를 앞질렀고, o4-mini-high(28.3%)에 근접한 성능을 보였습니다. 코딩 능력을 측정하는 SWE-bench Verified에서도 뛰어난 성과를 거두었습니다.
실제 사용자들의 반응도 긍정적입니다. 레딧의 한 사용자는 “GLM-4.5가 코딩에서 절대적으로 뛰어나다. 최근 Claude보다 훨씬 좋다”고 평가했고, 해커뉴스의 또 다른 사용자는 “DeepSeek R1이나 Qwen에서는 잘 작동하지 않았던 도구 사용과 지시 따르기가 일관되게 잘 작동한다”며 “현재 최고의 오픈소스 코딩 모델”이라고 평했습니다.
경제성과 접근성의 혁신
GLM-4.5의 또 다른 강점은 가격 경쟁력입니다. GLM-4.5는 입력 토큰 100만 개당 0.6달러, 출력 토큰 100만 개당 2.2달러로 책정되어 있으며, GLM-4.5-Air는 각각 0.2달러와 1.1달러로 더욱 저렴합니다. Artificial Analysis에 따르면 GLM-4.5는 평균 대비 저렴한 가격대에 속하면서도 높은 성능을 제공하는 것으로 평가됩니다.
더 중요한 것은 오픈소스 공개입니다. Apache/MIT 라이선스 하에 공개된 GLM-4.5는 기업들이 자체 AI 스택을 구축하고 로컬 환경에서 실행할 수 있게 해줍니다. 이는 상업적 활용까지 가능한 수준의 개방성으로, 개발자 커뮤니티로부터 큰 환영을 받고 있습니다.
AI 패권 경쟁의 지형 변화
GLM-4.5의 등장은 단순한 기술적 성취를 넘어 글로벌 AI 패권 경쟁의 판도 변화를 의미합니다. 그동안 서구, 특히 미국 기업들이 주도해온 AI 분야에서 중국 기업들이 본격적인 도전장을 내민 것입니다.
현재 중국은 전 세계 AI 모델의 40%를 보유하고 있으며, 최근 오픈소스 모델 순위에서 중국 모델들이 상위권을 휩쓸고 있습니다. 이는 몇 년 전만 해도 상상하기 어려운 일이었습니다.

특히 주목할 점은 중국 모델들이 단순히 기술적 성능만이 아니라 비용 효율성까지 앞서고 있다는 것입니다. 이는 OpenAI, Anthropic 등 서구 AI 기업들에게는 이중의 압박이 됩니다. 성능 경쟁에서 밀리면서 동시에 가격 경쟁력까지 잃을 위험에 처한 것입니다.
실무 관점에서의 활용 가능성
기업과 개발자들에게 GLM-4.5는 매력적인 선택지입니다. 먼저 오픈소스 특성상 모델을 직접 다운로드해 커스터마이징할 수 있어 데이터 보안이 중요한 기업 환경에 적합합니다. Z.ai 웹사이트에서 직접 테스트하거나, API를 통한 연동, 또는 HuggingFace와 ModelScope에서 오픈 웨이트 버전을 다운로드할 수 있습니다.
코딩 지원 분야에서는 특히 뛰어난 성능을 보이고 있어, Claude Code, Roo Code, CodeGeex 등 기존 코딩 툴킷과의 통합도 가능합니다. 듀얼 모드 시스템 덕분에 간단한 질의응답부터 복잡한 추론이 필요한 작업까지 상황에 맞는 대응이 가능합니다.
향후 전망과 시사점
GLM-4.5의 성공은 AI 업계에 몇 가지 중요한 시사점을 제공합니다. 첫째, 고성능과 개방성이 더 이상 상호 배타적이지 않다는 점입니다. 둘째, 중국 AI 기업들이 단순한 추격자에서 혁신의 주도자로 부상하고 있다는 점입니다.
OpenAI는 이제 GPT-2를 조심스럽게 오픈소스로 공개했던 초기와는 완전히 다른 환경에 직면했습니다. 경쟁자들로 가득한 시장에서 더 이상 선발주자의 이점을 누릴 수 없게 된 것입니다. Meta 역시 Llama 4 Behemoth 개발을 중단하고 ‘초지능’ 팀 구성에 집중하면서 기존 전략의 재검토를 시사하고 있습니다.
GLM-4.5는 단순한 벤치마크 숫자 이상의 의미를 갖습니다. 주권적 AI 스택 구축이라는 각국의 필요에 부응하는 실질적인 대안을 제시하고 있기 때문입니다. Z.ai가 slime과 같은 RL 인프라까지 함께 공개한 것은 단순한 모델 제공을 넘어 생태계 구축을 목표로 한다는 의미로 해석됩니다.
AI 패권 경쟁이 새로운 국면에 접어든 가운데, GLM-4.5는 더 이상 혁신이 특정 지역이나 기업의 전유물이 아님을 보여주는 상징적 사례가 되고 있습니다. 앞으로 이러한 경쟁이 어떻게 전개될지, 그리고 사용자들에게는 어떤 혜택을 가져다줄지 주목됩니다.
참고자료:
Comments