qwq-32b1 [AI 오픈소스] QwQ-32B: Deepseek-R1급 성능의 AI 추론 모델 안녕하세요.오늘은 알리바바에서 공개한 Deepseek-R1 급 성능의 오픈소스 추론 모델인 QwQ-32B를 소개드립니다.1. QwQ-32B 란?QwQ-32B는 알리바바에서 공개한 추론 모델로 320억 개의 매개변수를 가졌으며, 강화 학습(Reinforcement Learning, RL)을 적용하여 성능을 극대화한 AI 시스템입니다. 기존의 사전 학습(pretraining) 및 후처리(post-training) 방식에서 한 단계 더 나아가 RL을 통해 논리적 추론과 문제 해결 능력을 강화하였습니다. 📌 주요 스펙속성내용유형인과적 언어 모델 (Causal Language Models)학습 단계사전 학습(Pretraining) 및 추가 학습(Post-training)(지도 미세조정 및 강화학습)아키텍처Tra.. 2025. 3. 11. 이전 1 다음 반응형