阿里开源千问3,性能全球领先且部署成本大幅下降

4月29日凌晨,阿里巴巴发布新一代通义千问模型Qwen3。该模型参数量仅为DeepSeek-R1的1/3,成本更低,性能超越多个国际领先模型,成为全球最强开源模型。千问3是国内首个‘混合推理模型’,集成‘快思考’与‘慢思考’功能,采用MoE架构,总参数量235B,激活仅需22B。其预训练数据达36T tokens,并经过多轮强化学习,推理、指令遵循等能力显著提升。同时,仅需4张H20显卡即可部署满血版,显存占用更少,算力消耗大幅降低。

免责声明:本文内容由开放的智能模型自动生成,仅供参考。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1