UI-TARS-1.5正式发布,强化多模态智能体推理能力

豆包大模型团队昨日宣布,开源多模态智能体UI-TARS-1.5正式发布。该版本基于视觉-语言模型构建,具备高效执行虚拟世界任务的能力。通过强化学习,UI-TARS-1.5显著提升了高阶推理能力,能够在“行动”前进行“思考”,从而更好地完成复杂任务。

此次更新还提出以游戏为载体增强模型推理能力的新方向。相比数学或编程领域,游戏更依赖直观和常识性推理,成为评估模型通用能力的理想场景。此外,UI-TARS-1.5在视觉感知、系统推理、动作建模及训练范式四个方面实现技术突破,进一步优化了跨平台操作的精准性和适应性。

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1