Models & Algorithms🇺🇸 English

Qwen3-Max-Thinking 스냅샷 공개: 추론형 AI의 새로운 기준

최근 LLM 시장의 트렌드는 단순히 '더 많은 데이터'를 학습하는 것을 넘어, 모델이 '어떻게 생각하느냐'에 집중하고 있습니다. 알리바바 클라우드(Alibaba Cloud)가 자사의 가장 강력한 모델 Qwen3-Max-Thinking의 API 스냅샷(qwen3-max-2026-01-23)을 공개했습니다.

Qwen3-Max-Thinking 스냅샷 공개: 추론형 AI의 새로운 기준

Qwen3-Max-Thinking 스냅샷 공개: 추론형 AI의 새로운 기준

최근 LLM 시장의 트렌드는 단순히 '더 많은 데이터'를 학습하는 것을 넘어, 모델이 '어떻게 생각하느냐'에 집중하고 있습니다. 알리바바 클라우드(Alibaba Cloud)가 자사의 가장 강력한 모델 Qwen3-Max-Thinking의 API 스냅샷(qwen3-max-2026-01-23)을 공개했습니다.

단순한 텍스트 생성을 넘어, 인간처럼 깊게 고민하고 스스로 도구를 선택하는 이 모델이 왜 현재 AI 생태계의 판도를 흔들고 있는지 핵심 내용을 정리했습니다.

"생각하는" AI: 테스트 타임 스케일링(Test-time Scaling)

Qwen3-Max-Thinking의 가장 큰 특징은 추론(Reasoning) 모드의 도입입니다. 이 모델은 답변 전 추론 단계를 강화(thinking mode)하고, 필요 시 도구 호출을 추론 흐름에 엮습니다.

  • 멀티 라운드 자기 검증: 멀티 라운드 테스트 타임 스케일링과 자기검증(자기수정) 루프를 통해 추론 품질을 끌어올립니다.
  • 병렬 테스트 타임 연산: 코드 인터프리터와 결합한 병렬 테스트 타임 연산(parallel test-time compute) 기법으로 수학적 추론 능력을 극대화합니다.
  • 정확성과 추적 가능성: 대수학, 정수론, 확률 등 기술적 문제 해결에서 정확성과 논리 추적이 가능한 답변을 제공합니다.

스스로 도구를 고르는 '적응형 도구 사용(Adaptive Tool-use)'

기존 모델들이 사용자가 지정해 준 도구(검색, 코드 실행 등)만 사용했다면, Qwen3-Max-Thinking은 대화 맥락에 따라 자율적으로 도구를 선택합니다.

Model Studio 문서에 따르면, Thinking 모드에서는 3가지 built-in tools를 interleaved thinking 방식으로 추론 과정에 통합합니다:

  • 웹 검색(Web Search): 최신 정보가 필요할 때 스스로 검색 엔진을 호출합니다.
  • 웹페이지 콘텐츠 추출(Webpage Content Extraction): 웹페이지 내용을 추출하여 분석에 활용합니다.
  • 코드 인터프리터(Code Interpreter): 복잡한 수학 계산이나 데이터 분석이 필요하면 즉석에서 파이썬 코드를 작성하고 실행합니다.

벤치마크: 도구 활용 시 수학 추론 만점 달성

Qwen3-Max-Thinking은 도구 사용(tool usage) + 스케일드 테스트 타임 컴퓨트 조건에서 수학 추론 분야 최고 성적을 거뒀습니다.

벤치마크점수조건
AIME 2025100%코드 인터프리터 + 병렬 테스트 타임 연산
HMMT100%코드 인터프리터 + 병렬 테스트 타임 연산
GPQA우수박사급 과학 추론

기술 사양

알리바바는 이번 모델을 통해 1조 개 이상의 파라미터와 강화 학습의 결합이 어디까지 도달할 수 있는지를 증명했습니다.

  • 파라미터: 1T+ (조 단위)
  • 학습 데이터: 36T 토큰
  • 학습 컨텍스트: ChunkFlow 기술로 최대 1M 토큰까지 학습 가능
  • 아키텍처: MoE (Mixture of Experts)

서비스 컨텍스트 윈도우

모델컨텍스트최대 입력최대 출력
qwen3-max (비추론)262,144258,04865,536
qwen3-max-2026-01-23 (Thinking)81,920--

※ 스냅샷(Thinking)은 문서에서 컨텍스트(81,920) 중심으로 표기되며, 세부 상한은 배포/호출 방식에 따라 달라질 수 있어 최신 문서를 따릅니다.

가격 (구간별 차등 요금)

Qwen3-Max는 입력 토큰 구간에 따라 가격이 달라지는 tiered pricing을 적용합니다:

입력 토큰 구간입력 가격 (1M당)출력 가격 (1M당)
≤32K$1.20$6.00
32K~128K$2.40$12.00
128K+$3.00$15.00

※ 배포 모드(International/US/Mainland China)에 따라 단가 표가 다르므로, 본 표는 Model Studio 문서의 $1.2/$6 구간 표 기준입니다. 최신 가격은 Model Studio 문서에서 배포 모드별 표를 확인하세요.

향후 로드맵

연구진은 다음 영역에서의 개선을 예고했습니다:

  • 다국어 추론: 영어 외 언어에서의 추론 능력 강화
  • 안전성 정렬(Safety Alignment): 더 안전한 AI 응답 생성
  • 분포 변화 대응(Robustness under Distribution Shift): 학습 데이터와 다른 상황에서의 견고성

지금 바로 사용하기

"단순히 아는 것이 많은 AI에서, 제대로 생각할 줄 아는 AI로의 진화"

Qwen3-Max-Thinking은 현재 다음 채널에서 이용 가능합니다:

  • 웹: chat.qwen.ai (Qwen Chat)
  • API: 알리바바 클라우드 Model Studio (qwen3-max-2026-01-23 스냅샷)

기업 사용자는 금융, 연구, 운영 등 다양한 분야에서 도구 사용과 단계별 추론 기능을 테스트할 수 있습니다.

참고 자료

더 많은 콘텐츠를 받아보세요

SNS에서 새로운 글과 튜토리얼 소식을 가장 먼저 받아보세요

이메일로 받아보기

관련 포스트