智谱技术团队开源CogAgent-9B-20241220模型，推动智能体任务发展- DoNews

DoNews > 公司新闻 > 智谱技术团队开源CogAgent-9B-20241220模型，推动智能体任务发展

智谱技术团队开源CogAgent-9B-20241220模型，推动智能体任务发展

2024-12-27 08:23:08

智谱技术团队于12月26日通过其公众号宣布，开源了CogAgent-9B-20241220模型。这一模型基于GLM-4V-9B训练，专为智能体（Agent）任务设计，仅需屏幕截图作为输入，无需HTML等文本表征，便能根据用户指定的任务，结合历史操作，预测下一步的GUI操作。

CogAgent-9B-20241220模型的普适性使其可广泛应用于个人电脑、手机、车机设备等基于GUI交互的场景。相较于2023年12月开源的第一版CogAgent模型，新版本在GUI感知、推理预测准确性、动作空间完善性、任务普适性和泛化性等方面均实现了显著提升，并支持中英文双语的屏幕截图和语言交互。

该模型的输入仅包含用户的自然语言指令、已执行历史动作记录和GUI截图，无需任何文本形式表征的布局信息或附加元素标签信息。其输出涵盖思考过程、下一步动作的自然语言描述、下一步动作的结构化描述以及下一步动作的敏感性判断四个方面。

CogAgent-9B-20241220在多个数据集上进行了测试，并与GPT-4o-20240806、Claude-3.5-Sonnet等模型进行了比较，结果显示其在多个数据集上取得了领先的结果，证明了其在GUI Agent领域强大的性能。

蔚来全新品牌firefly萤火虫首款同名车型正式上市，11.98万元起第三品牌。

售价89.90万元起，极氪009光辉典藏版正式上市尊享体验。

一骑手造谣“去其他平台跑单会被美团永久封号”，已被处罚注意。

算法编织了“信息茧房”？抖音公开澄清短视频平台到底有没有为用户编织一个个的“信息茧房”？

2025上海车展广汽展台亮点抢先看 AI生态版图发布、四款新车全球首发！

全新智己L6正式发布，预售权益价21.99万元~28.99万元全新智己L6正式发布，预售权益价21.99万元~28.99万元

优刻得2024年亏损2.41亿元公有云业务同比微增2% 云计算厂家。

掌阅科技 2024 年营收 25.83 亿元同比下降 7.02% 净利润 4929.17 万元。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号