阿里通义千问推出开源视觉推理模型QVQ-72B-Preview- DoNews

DoNews > 公司新闻 > 阿里通义千问推出开源视觉推理模型QVQ-72B-Preview

阿里通义千问推出开源视觉推理模型QVQ-72B-Preview

2024-12-25 11:37:42

阿里通义千问团队于12月25日宣布推出开源视觉推理模型QVQ-72B-Preview，该模型基于Qwen2-VL-72B构建，旨在增强视觉推理能力。QVQ-72B-Preview在多个数据集上进行了评估，包括MMMU、MathVista、MathVision和OlympiadBench。

在MMMU基准测试中，QVQ-72B-Preview取得了70.3的分数，显著超越了Qwen2-VL-72B-Instruct。此外，在MathVista、MathVision和OlympiadBench等专注于数学和科学问题的基准测试中，该模型也表现出色，有效缩小了与领先的最先进的o1模型之间的差距。

尽管QVQ-72B-Preview在视觉推理方面表现优异，但团队也指出了该模型的一些限制，包括语言混合与切换、递归推理、安全和伦理考虑以及性能和基准限制。用户在部署时应保持谨慎，并注意这些潜在问题。

阿里通义千问团队表示，QVQ-72B-Preview是一个实验性研究模型，专注于增强视觉推理能力，未来将继续优化和改进该模型，以提升其在复杂问题上的表现。

江波龙港股IPO：欠债79亿，实控人分红1.29亿 A+H。

艾铁成离任，蔚来能源负责人沈斐出任乐道总裁变革。

中国卫通2024年实现净利润4.54亿元同比增长30.31%。

官方回应小米 SU7 高速上碰撞爆燃； iOS / iPadOS 18.4 发布；小米汽车上线“安全分”功能｜Do早报 Hello，大家早上好，又是元气满满的一天，先来浏览新鲜的早报吧～

英特尔 CEO 陈立武宣布将剥离非核心业务痛定思痛。

小米汽车App正内测“安全分”系统：评估驾驶行为促进安全驾驶急需。

欧菲光 2024 年营收 204.37 亿元同比增长 21.19% 净利润同比下降 24.09%。

雅居乐去年净亏损约175亿元，预期政策会持续宽松仍未回暖。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号