天眼查App显示,近日,浪潮电子信息产业股份有限公司公开了一项名为“视觉语言模型训练方法、设备、介质及计算机程序产品”的发明专利,专利号为CN202411719465.2。该专利涉及人工智能视觉处理技术领域,旨在通过创新的训练方法提升视觉语言模型的图像处理能力。
该专利的核心技术在于构建了一个层级式视觉特征库,包括全局视觉特征、前景视觉特征和聚合视觉特征。在训练过程中,利用视觉语言模型的视觉提示器进行层级式筛选,从而提高查询示例图像的效率和质量。此外,该技术通过计算关联示例图像与查询图像之间的相似性损失值以及图像处理结果的处理损失值,来更新视觉感知模型的参数,实现对视觉语言模型的全局优化。
相较于传统的局部模块适配方式,这种全局优化策略能够避免模型陷入局部最优,从而进一步提高图像处理的质量。该技术的应用前景广阔,有望在医疗影像分析、自动驾驶、智能安防等领域发挥重要作用。
浪潮电子信息产业股份有限公司表示,该专利的公开标志着公司在人工智能视觉处理技术领域取得了重要突破,未来将继续加大研发投入,推动相关技术的商业化应用。
风险警告:本文根据网络内容由AI生成,内容仅供参考,不应作为专业建议或决策依据。用户应自行判断和验证信息的准确性和可靠性,本站不承担可能产生的任何风险和责任。内容如有问题,可联系本站删除。