今日凌晨,阿里巴巴正式推出新一代通义千问Qwen3系列模型,凭借卓越性能一举登顶全球最强开源模型。该系列涵盖多个版本,从Qwen3-0.6B到Qwen3-32B,以及更强大的MoE模型如Qwen3-30B-A3B和Qwen3-235B-A22B,参数规模从数亿至2350亿不等,支持上下文长度最高达128K。
Qwen3的最大亮点在于其“混合推理”能力,将“快思考”与“慢思考”集成于同一模型中,大幅降低算力消耗。用户可根据需求选择适合的思考模式:复杂问题可通过多步推理解决,简单问题则实现快速响应。此外,Qwen3支持119种语言,预训练数据量达36万亿个token,远超前代Qwen2.5。
阿里云还开源了六个Dense模型及两个MoE模型权重,进一步推动大模型技术的发展。据测试,Qwen3在代码、数学等领域表现优异,部分小模型性能甚至媲美更大规模的前代产品。这一突破为全球用户提供了更多高效、灵活的选择。