Qwen3.6-Max, 코딩 벤치마크 1위지만 오픈소스는 없다, Alibaba의 전략 전환

2026-04-22

﹒

AI 트렌드 분석

﹒

2 minutes

Qwen은 줄곧 서방 독점 AI에 맞서는 오픈소스 대안으로 자리잡아 왔습니다. 그런데 이번 플래그십 모델만큼은 달랐습니다. 처음으로, 코드가 공개되지 않았습니다.

사진 출처: buildfastwithai.com / Awesome Agents

Alibaba가 4월 20일 Qwen3.6-Max-Preview를 공개했습니다. Qwen 시리즈 역사상 처음으로 가중치(weights)를 공개하지 않은 클로즈드 모델입니다. SWE-bench Pro, Terminal-Bench 2.0을 포함한 6개 코딩 벤치마크에서 1위를 차지했고, Artificial Analysis Intelligence Index에서는 203개 모델 중 3위(점수 52)를 기록하며 OpenAI와 Anthropic 최상위 모델 바로 뒤에 위치합니다.

출처: Qwen3.6 Max Preview – Intelligence, Performance & Price Analysis – Artificial Analysis

오픈소스 포기, 처음으로

Qwen3.6-Max-Preview는 Hugging Face에 올라오지 않았습니다. 자체 서버에서 돌릴 방법도 없습니다. 개발자는 Qwen Studio나 Alibaba Cloud Model Studio를 통한 API 접근만 가능합니다.

이건 Qwen에게 꽤 큰 전환입니다. 같은 달 출시된 Qwen3.6-35B-A3B는 Apache 2.0 라이선스로 Hugging Face에 공개되어 있고, 24GB RAM 소비자용 GPU에서도 돌아갑니다. 반면 Max는 처음부터 클로즈드로 설계됐습니다.

Alibaba의 전략이 이제 선명해졌습니다. 중간 티어는 오픈소스로 개발자 커뮤니티 채택을 끌어들이고, 최상위 티어는 API 전용으로 엔터프라이즈 수익을 잡는 구조입니다. 같은 날 Qwen Code의 무료 플랜이 동시에 종료된 것도 우연이 아닙니다. 무료로 채택을 심고, 유료로 수익을 거두는 전형적인 사이클이 완성된 셈입니다.

이 패턴은 Meta가 Llama 프론티어 티어를 닫으면서 택한 것과 같은 플레이북입니다. Qwen의 “오픈소스 강자”라는 정체성을 감안하면 늦게 왔지만, 결국 같은 방향으로 수렴했습니다.

코딩 성능과 한 가지 주의사항

벤치마크 수치 자체는 인상적입니다. SkillsBench에서 이전 모델 대비 9.9점, SciCode에서 10.8점 개선됐고, QwenWebBench에서는 ELO 1558로 최고점을 기록했습니다. 현재 에이전틱 코딩 작업에서 가장 강력한 모델 중 하나라는 평가가 나오는 이유입니다.

다만 한 가지 눈여겨볼 부분이 있습니다. 평가 과정에서 Qwen3.6-Max-Preview가 생성한 출력 토큰은 7,400만 개로, 동일 평가 모델들의 중앙값 2,400만 개의 약 3배에 달했습니다. 벤치마크 순위는 높지만 실제 프로덕션 환경에서는 지연 시간과 비용 측면에서 불리하게 작용할 수 있습니다. 프리뷰 단계에서 나타나는 이 높은 출력량이 정식 출시 전에 조정될지 지켜볼 필요가 있습니다.

구조적으로는 256k 토큰 컨텍스트 창을 갖추고, 기본적으로 체인오브소트(chain-of-thought) 추론이 활성화됩니다. API는 OpenAI와 Anthropic 양쪽 형식을 모두 지원해서 기존 SDK를 쓰는 팀이라면 baseURL만 바꿔 바로 붙일 수 있습니다.

“중국 오픈소스 = 대안”이라는 공식의 균열

Qwen3.6-35B-A3B는 여전히 오픈소스이고 성능도 충분히 강력합니다. 하지만 “가장 좋은 것”과 “공개된 것” 사이의 간격이 이번에 처음으로 벌어졌습니다.

Artificial Analysis는 이번 모델에 대한 독립적인 성능 및 비용 분석을 제공하고 있지만, 가격 정책은 아직 미공개 상태입니다. 프리뷰 기간 동안은 평가 비용이 $0으로 표시되어 있어 Claude Opus나 GPT-5 계열과의 실질적인 비용 비교는 정식 출시 후에야 가능합니다.

Artificial Analysis의 전체 벤치마크 데이터와 다른 모델과의 상세 비교는 원문에서 확인할 수 있습니다.

참고자료:

Alibaba’s Qwen3.6-Max Ships Closed – Tops Six Coding Evals – Awesome Agents
Qwen3.6-Max-Preview 공식 블로그 – Qwen

Like?

AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)

AI Sparkup

Qwen3.6-Max, 코딩 벤치마크 1위지만 오픈소스는 없다, Alibaba의 전략 전환

오픈소스 포기, 처음으로

코딩 성능과 한 가지 주의사항

“중국 오픈소스 = 대안”이라는 공식의 균열

AI Sparkup 구독하기

Comments

답글 남기기 응답 취소

More posts

AI라는 말 대신 생각하기와 행동하기로 바꾸면 보이는 것들

AI 모델 격차는 사라졌는데.. 승부는 다른 데서 갈렸다

설계는 비싼 모델, 실행은 저렴한 모델, 이 조합이 통하지 않는 이유

에이전트가 침투하고 에이전트가 막았다, 허깅페이스 해킹의 전말