AI Sparkup

최신 AI 쉽게 깊게 따라잡기⚡

Qwen – Alibaba의 오픈소스 대형 언어 모델 시리즈

Qwen(千问)은 Alibaba Cloud가 개발·공개하는 대형 언어 모델(LLM) 시리즈다. 텍스트 생성, 코드 작성, 이미지·비디오 이해, 문서 처리 등 다양한 기능을 지원하며, 오픈소스 가중치와 API 모두 제공한다. 2026년 4월 기준 최신 모델인 Qwen3.6-Max-Preview가 SWE-bench Pro, Terminal-Bench 2.0 등 6개 주요 코딩 벤치마크에서 1위를 기록했다.

Qwen3.6-Max-Preview

Qwen3.6-Plus의 후속 독점 모델 미리보기로, 세 가지 영역에서 전 버전 대비 유의미한 개선을 이뤘다.

주요 개선 사항 (vs Qwen3.6-Plus)

영역벤치마크개선 폭
에이전트 코딩SkillsBench+9.9
SciCode+6.3
NL2Repo+5.0
Terminal-Bench 2.0+3.8
세계 지식QwenChineseBench+5.3
SuperGPQA+2.3
지시 따르기ToolcallFormatIFBench+2.8

6개 주요 코딩 벤치마크(SWE-bench Pro, Terminal-Bench 2.0, SkillsBench, QwenClawBench, QwenWebBench, SciCode)에서 최고 점수 기록.

접근 방법

  • Qwen Studio: chat.qwen.ai에서 대화형 사용
  • API: Alibaba Cloud Model Studio에서 qwen3.6-max-preview 모델명으로 호출 (OpenAI 호환 프로토콜 지원)
from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DASHSCOPE_API_KEY"],
    base_url="https://dashscope-intl.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen3.6-max-preview",
    messages=[{"role": "user", "content": "..."}],
    extra_body={"enable_thinking": True},
    stream=True,
)

에이전트 작업 권장 설정: preserve_thinking: True — 이전 턴의 추론 내용을 메시지에 유지해 멀티턴 에이전트 성능을 높임

API 리전: 베이징·싱가포르·미국(버지니아) 엔드포인트 선택 가능.

Qwen3.6-27B: 27B 밀집 모델로 플래그십급 코딩

2026년 4월 22일 공개된 Qwen3.6-27B는 27B 파라미터 밀집 모델(dense model)로 이전 플래그십이던 Qwen3.5-397B-A17B(총 397B, 활성 17B MoE)를 모든 주요 코딩 벤치마크에서 넘어섰다.

항목Qwen3.5-397B-A17BQwen3.6-27B
모델 크기807 GB55.6 GB
Q4_K_M 양자화 크기16.8 GB
성능이전 플래그십전 플래그십 초과

Simon Willison이 M 시리즈 Mac에서 llama.cpp(llama-server)를 사용해 Q4_K_M 양자화 버전을 실행하고 SVG 생성을 테스트한 결과 “16.8GB 로컬 모델 중 최고 수준”이라는 평가를 남겼다.

# llama.cpp로 로컬 실행
brew install llama.cpp

llama-server \
    -hf unsloth/Qwen3.6-27B-GGUF:Q4_K_M \
    --no-mmproj --fit on -np 1 -c 65536 \
    --cache-ram 4096 -ctxcp 2 --jinja \
    --temp 0.6 --top-p 0.95 --top-k 20 \
    --reasoning on \
    --chat-template-kwargs '{"preserve_thinking": true}'

성능(Q4_K_M, M 시리즈 Mac): 약 25 tok/s 생성, 6,500 토큰 생성에 약 4분.

모델 라인업

모델특징
Qwen3.7-Max2026년 5월 발표, 장시간 에이전트 실행·코딩·복잡한 추론을 겨냥한 Model Studio 제공 예정 모델
Qwen3.6-Max-Preview2026년 4월 미리보기, 에이전트 코딩·지식·지시 따르기 강화
Qwen3.6-27B27B 밀집 모델, 플래그십급 코딩, 로컬 실행 가능 (55.6 GB)
Qwen3.6-PlusMax-Preview의 전 버전, 기준선 모델
Qwen-VL비전-언어 멀티모달
Qwen-Coder코드 특화
Qwen-Audio오디오 이해

주요 특징

  • 광범위한 모달리티: 텍스트·코드·이미지·비디오 이해, 이미지 생성, 문서 처리
  • 웹 검색 통합: 실시간 정보 검색 기능 내장
  • 툴 사용 및 아티팩트: 함수 호출(tool use), 코드 실행, 구조화 출력 지원
  • OpenAI + Anthropic 호환 API: 기존 코드 마이그레이션 부담 최소화
  • 오픈소스 + 상용 이중 전략: 소형 모델은 Apache 2.0으로 공개, 대형 모델은 API 형태

사용 대상 및 케이스

  • 에이전트 코딩 파이프라인 구축자: SWE-bench 수준의 자율 코딩 에이전트에 최적화된 모델 탐색 중인 팀
  • 기업: OpenAI 호환 API로 기존 인프라를 그대로 유지하면서 Qwen으로 전환
  • 연구자: 오픈소스 가중치를 파인튜닝해 특정 도메인 특화 모델 개발
  • 멀티모달 앱 빌더: 이미지/비디오 이해가 필요한 서비스에 Qwen-VL 활용

라이선스

모델별 상이. 소형 오픈소스 모델은 Apache 2.0 또는 자체 Qwen 라이선스 적용. Qwen3.6-Max-Preview는 독점 모델(API 전용).

관련 문서

  • kimi — 비슷한 포지션의 오픈소스 코딩 특화 모델 Kimi K2.6
  • agent-harness — Qwen3.6-Max-Preview를 에이전트 하네스에 통합하는 방법
  • lightrag — Qwen 모델과 함께 사용 가능한 RAG 시스템
  • flashqla — Qwen 팀이 공개한 GDN 선형 어텐션용 고성능 CUDA 커널 라이브러리
  • cybersecqwen-4b — Qwen 기반 방어적 사이버보안 특화 소형 로컬 실행 모델
  • local-slm-tips-m4-24gb — M4 24GB MacBook에서 Qwen 3.5-9B Q4 실용 운용 팁
  • qwen-image-2 — 2K 생성·편집과 타이포그래피에 강한 Qwen 이미지 모델
  • qwen-3-7 — 장시간 에이전트 실행을 겨냥한 Alibaba의 차세대 모델


AI Sparkup 구독하기

최신 게시물 요약과 더 심층적인 정보를 이메일로 받아 보세요! (무료)