Qwen – Alibaba의 오픈소스 대형 언어 모델 시리즈

Qwen3.6-Max-Preview
주요 개선 사항 (vs Qwen3.6-Plus)
접근 방법
Qwen3.6-27B: 27B 밀집 모델로 플래그십급 코딩
모델 라인업
주요 특징
사용 대상 및 케이스
라이선스
관련 문서

Qwen(千问)은 Alibaba Cloud가 개발·공개하는 대형 언어 모델(LLM) 시리즈다. 텍스트 생성, 코드 작성, 이미지·비디오 이해, 문서 처리 등 다양한 기능을 지원하며, 오픈소스 가중치와 API 모두 제공한다. 2026년 4월 기준 최신 모델인 Qwen3.6-Max-Preview가 SWE-bench Pro, Terminal-Bench 2.0 등 6개 주요 코딩 벤치마크에서 1위를 기록했다.

Qwen3.6-Max-Preview

Qwen3.6-Plus의 후속 독점 모델 미리보기로, 세 가지 영역에서 전 버전 대비 유의미한 개선을 이뤘다.

주요 개선 사항 (vs Qwen3.6-Plus)

영역	벤치마크	개선 폭
에이전트 코딩	SkillsBench	+9.9
	SciCode	+6.3
	NL2Repo	+5.0
	Terminal-Bench 2.0	+3.8
세계 지식	QwenChineseBench	+5.3
	SuperGPQA	+2.3
지시 따르기	ToolcallFormatIFBench	+2.8

6개 주요 코딩 벤치마크(SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode)에서 최고 점수 기록.

접근 방법

Qwen Studio: chat.qwen.ai에서 대화형 사용
API: Alibaba Cloud Model Studio에서 qwen3.6-max-preview 모델명으로 호출 (OpenAI 호환 프로토콜 지원)

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3.6-max-preview",
    messages=[{"role": "user", "content": "..."}],
    extra_body={"enable_thinking": True},
    stream=True,
)

에이전트 작업 권장 설정: preserve_thinking: True — 이전 턴의 추론 내용을 메시지에 유지해 멀티턴 에이전트 성능을 높임

API 리전: 베이징·싱가포르·미국(버지니아) 엔드포인트 선택 가능.

Qwen3.6-27B: 27B 밀집 모델로 플래그십급 코딩

2026년 4월 22일 공개된 Qwen3.6-27B는 27B 파라미터 밀집 모델(dense model)로 이전 플래그십이던 Qwen3.5-397B-A17B(총 397B, 활성 17B MoE)를 모든 주요 코딩 벤치마크에서 넘어섰다.

항목	Qwen3.5-397B-A17B	Qwen3.6-27B
모델 크기	807 GB	55.6 GB
Q4_K_M 양자화 크기	–	16.8 GB
성능	이전 플래그십	전 플래그십 초과

Simon Willison이 M 시리즈 Mac에서 llama.cpp(llama-server)를 사용해 Q4_K_M 양자화 버전을 실행하고 SVG 생성을 테스트한 결과 “16.8GB 로컬 모델 중 최고 수준”이라는 평가를 남겼다.

# llama.cpp로 로컬 실행
brew install llama.cpp

llama-server \
    -hf unsloth/Qwen3.6-27B-GGUF:Q4_K_M \
    --no-mmproj --fit on -np 1 -c 65536 \
    --cache-ram 4096 -ctxcp 2 --jinja \
    --temp 0.6 --top-p 0.95 --top-k 20 \
    --reasoning on \
    --chat-template-kwargs '{"preserve_thinking": true}'

성능(Q4_K_M, M 시리즈 Mac): 약 25 tok/s 생성, 6,500 토큰 생성에 약 4분.

모델 라인업

모델	특징
Qwen3.7-Max	2026년 5월 발표, 장시간 에이전트 실행·코딩·복잡한 추론을 겨냥한 Model Studio 제공 예정 모델
Qwen3.6-Max-Preview	2026년 4월 미리보기, 에이전트 코딩·지식·지시 따르기 강화
Qwen3.6-27B	27B 밀집 모델, 플래그십급 코딩, 로컬 실행 가능 (55.6 GB)
Qwen3.6-Plus	Max-Preview의 전 버전, 기준선 모델
Qwen-VL	비전-언어 멀티모달
Qwen-Coder	코드 특화
Qwen-Audio	오디오 이해

주요 특징

광범위한 모달리티: 텍스트·코드·이미지·비디오 이해, 이미지 생성, 문서 처리
웹 검색 통합: 실시간 정보 검색 기능 내장
툴 사용 및 아티팩트: 함수 호출(tool use), 코드 실행, 구조화 출력 지원
OpenAI + Anthropic 호환 API: 기존 코드 마이그레이션 부담 최소화
오픈소스 + 상용 이중 전략: 소형 모델은 Apache 2.0으로 공개, 대형 모델은 API 형태

사용 대상 및 케이스

에이전트 코딩 파이프라인 구축자: SWE-bench 수준의 자율 코딩 에이전트에 최적화된 모델 탐색 중인 팀
기업: OpenAI 호환 API로 기존 인프라를 그대로 유지하면서 Qwen으로 전환
연구자: 오픈소스 가중치를 파인튜닝해 특정 도메인 특화 모델 개발
멀티모달 앱 빌더: 이미지/비디오 이해가 필요한 서비스에 Qwen-VL 활용

라이선스

모델별 상이. 소형 오픈소스 모델은 Apache 2.0 또는 자체 Qwen 라이선스 적용. Qwen3.6-Max-Preview는 독점 모델(API 전용).

AI Sparkup