阿里通义千问开源负责人林俊旸暗示,Qwen3系列模型可能于今日正式发布。此前,该系列模型曾在阿里巴巴旗下的ModelScope(魔搭)社区短暂亮相后下线,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,均采用Apache License 2.0开源协议。
从命名规则推测,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B为轻量化稠密模型,分别对应40亿、17亿和6亿参数规模,主打高效应用场景。而Qwen3-30B-A3B-Base则基于混合专家(MoE)架构,总参数达300亿,动态调用30亿参数处理任务。此外,Qwen3支持高达256K的上下文长度,覆盖推理与非推理任务。
自2023年8月以来,阿里云已陆续开源多代Qwen系列模型,涵盖全尺寸与全模态领域,此次发布将进一步丰富其技术生态。