4月28日,阿里巴巴发布并开源通义千问3.0(Qwen3)系列模型。该系列包括两个专家混合(MoE)模型和六个Dense模型,全部在Apache 2.0许可下开源。Qwen3支持119种语言,训练数据量是Qwen2.5的两倍,性能媲美DeepSeek R1和OpenAI o1等顶级模型。其“思考模式”和“非思考模式”可灵活应对复杂与简单任务,显著降低部署成本。此外,Qwen3便于Agent调用,可通过Fireworks AI等云服务使用。阿里称,Qwen3是通往通用人工智能(AGI)的重要里程碑,未来将继续优化架构和训练方法。
免责声明:本文内容由开放的智能模型自动生成,仅供参考。