英伟达发布DAM-3B模型精准描述图像视频局部细节- DoNews快讯

DoNews > 快讯 > 英伟达发布DAM-3B模型精准描述图像视频局部细节

英伟达发布DAM-3B模型精准描述图像视频局部细节

2025-04-24 13:57:02

204953

科技媒体Marktechpost报道，英伟达近日推出Describe Anything 3B（DAM-3B）AI模型，旨在解决图像和视频中特定区域的详细描述难题。传统视觉-语言模型（VLMs）在整体描述上表现优异，但对局部细节的捕捉常显不足。DAM-3B通过点选、框选或涂鸦等方式指定目标区域，生成精准且上下文相关的描述文本，其衍生版本DAM-3B-Video还支持动态视频分析。

该模型采用“焦点提示”和“局部视觉骨干网络”架构，兼顾高分辨率细节与全局背景，并通过门控交叉注意力机制融合特征。为弥补数据不足，英伟达开发了半自动标注策略，构建含150万样本的训练库。在多项基准测试中，DAM-3B以67.3%的平均准确率超越GPT-4o等模型，为无障碍工具、机器人及视频分析提供了新可能。模型已在Hugging Face平台开源。

比特币向上升破95000美元；刘波卸任OPPO中国区总裁；三只松鼠向港交所提交上市申请书｜Do早报大家早上好，又是元气满满的一天，一起来浏览今天的早报吧～

完美世界发布2024年报及2025一季报重回盈利轨道营收20.23亿元。

长城汽车 2025 年一季度净利润 17.51 亿元，同比降 45.6% 营收同比下降 6.63%。

华熙生物：一季度归母净利润1.02亿元，同比下降58.13% 营收同比减少20.77%。

公牛集团 2024 年归母净利润 42.72 亿元同比增长 10.39%。

沪硅产业2024年营收同比增长6.18% 300mm硅片产能突破65万片/月营收33.88亿元。

网易游戏全球投资与合作部总裁朱原离职李日强接手持续动荡。

广汽集团第一季度营收 196.5 亿元同比下降 7.95% 亏损 7.32 亿元。

关于我们| 电子协议| 合作联系| 蜀ICP备2024059877号-1

网站信息

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1
联系地址：北京市海淀区宝盛东路兴华绿色产业楼3层307室（东升地区）
违法和不良信息举报电话：010-87538607 邮箱：jubao@infinities.com.cn
网上有害信息举报专区: www.12377.cn

Copyright © DoNews 2000-2025 All Rights Reserved
蜀ICP备2024059877号-1

京公网安备11010802023059号