阿里巴巴发布千问3,登顶全球最强开源模型

4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen3。该模型参数量仅为DeepSeek-R1的1/3,成本显著下降,性能全面超越R1与OpenAI-o1等模型。千问3是国内首个‘混合推理模型’,采用MoE架构,总参数量235B,激活仅需22B。预训练数据达36T tokens,经过多轮强化学习,大幅增强推理、指令遵循及多语言能力。部署成本低,仅需4张H20显卡即可运行满血版。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1