DoNews6月6日消息,近日,蘑菇车联提出BalanceHRNet人体姿态估计模型,能够帮助自动驾驶精准识别行人意图。这一研究成果被国际顶级期刊Neural Networks收录。
Neural Networks是世界三大神经网络领域权威学术期刊之一,也是SCI一区期刊,涉及行为学、脑建模、学习算法、数学和计算分析,以及使用神经网络概念和技术的工程和技术应用。
目前,人体姿态估计的主流方法是使用神经网络来识别人体关键点。近年来,该领域研究人员提出多种深度学习模型来提高人体姿态估计的准确性,包括主流的HigherHRNe模型。
尽管这一模型已经取得很大进步,但在复杂环境或者拥挤场景下,不同个体间的相互遮挡会导致检测难度激增,识别准确性会大大降低。
鉴于此,蘑菇车联提出BalanceHRNet模型,该模型借鉴HigherHRNet的多分支结构和融合方法,克服HigherHRNet无法获取大感受野的缺点,在更小计算量的情况下提高准确性。
BalanceHRNet具有三大优势:具备更大感受野,可以提取更丰富的语义信息,并且具有较高准确性;提出平衡高分辨率模块BHRM,可以获取物体多尺度特征;学习不同分支的重要性,让模型自己决定不同分支的意义。
测试结果表明,BalanceHRNet能够有效提升人体姿态估计准确性。研究人员将CrowdPose数据集用作测试数据集,并以HigherHRNet、AlphaPose、OpenPose等模型为比较模型。
数据显示,BalanceHRNet测得平均正确率为63.0%,比最佳模型HigherHRNet提高3.1%,准确率为目前业界最高水平。每一帧画面的感知准确率都提升3.1%,数字看着小,但对自动驾驶安全性的整体提升影响很大。
研究人员还通过COCO(2017)关键点检测数据集展示BalanceHRNet网络的有效性,BalanceHRNet模型比平均正确率提高1.6%。
目前,BalanceHRNet已被蘑菇车联用于高精地图,提高了感知成功率和地图精度。
作为行业领先的自动驾驶全栈技术与运营服务提供商,蘑菇车联持续推动数字交通、自动驾驶领域的技术突破。
近半年来,蘑菇车联CAMO-MOT算法、IPS300+路侧多模态目标检测数据集、multi-to-single知识蒸馏框架、InterFusion融合感知、BalanceHRNet模型等研究成果陆续被国际顶级学术机构收录,这意味着相关技术达到世界领先水平。