知行编程网知行编程网  2022-06-14 18:00 知行编程网 隐藏边栏 |   抢沙发  59 
文章评分 0 次,平均分 0.0

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

来源 | arxiv

转自 | 新智元   编辑 | 雅新

【导读】谷歌研究人员最近在CVPR 2020上发表的一篇论文提出了用于边缘设备上运行的单人人体姿态估计算法BlazePose。该算法在中端手机CPU上的性能比20核桌面CPU上的OpenPose还要快25-75倍。 

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

根据图像或视频进行人体姿势估计在如健康跟踪、手语识别等实际应用中起着核心作用。由于个体会做出各种各样的姿势,此任务具有极大的挑战性。
 
谷歌研究人员最近在 CVPR 2020 上发表的一篇论文提出了用于边缘设备上运行的单人人体姿态估计算法BlazePose
 
在推断过程中,采用推断身体33个关键点的轻量卷积网络,用编解码器直接推断边框,并在Pixel 2手机上推断速度可达到30fps。BlazePose在中端手机CPU上性能比20核桌面CPU上的OpenPose还要快25-75倍。
       33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别论文地址:https://arxiv.org/pdf/2006.10204.pdf

   用面部检测器代替身体检测器,速度超OpenPose


最近的研究工作在姿势估计方面有了重大进展。而这些进展大都采用的方法是为每个关节生成热图以及每个坐标精炼偏移量。
 
虽然这种选择的热图可以扩展到多个人,但它使一个人的模型比适用于手机上的实时推断的模型大得多。而谷歌研究人员在此解决了这个特殊的用例,并演示了该模型的显著加速,而几乎没有质量下降。
 
与基于热图的技术相比,基于回归的方法虽然对计算的要求较低且可扩展性更高,但它们试图预测平均坐标值,但往往无法解决潜在的歧义。
 
研究人员在人体姿态估计上和之前的做法有很大的不同。
 
使用面部检测器而不是人体检测器检测人体。研究人员发现,由于使用身体检测器容易受场景中密集人群遮挡的影响,如果在遮挡严重状态下,身体检测器的信任值不会很高。
 
但是人的脸部比起全身就不容易被遮挡,而且在神经网络中这一部分的响应值往往是最高的。

 33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

网络是有两个部分组成,分别是关键点检测部分和关键点回归部分。这个网络新颖的地方在于,在训练阶段,关键点检测和回归一起训练。在测试的时候,去掉检测部分,仅保留回归部分,这样可以加快运行速度。

 
研究人员通过实验证明了这种方法在大幅加速的同时也没有损失精度,网络结构如下:
       33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

除此之外,研究人员在训练阶段根据模型的应用场景,针对性的对数据增强部分做了限制,这样降低了模型学习复杂场景的能力,但能让模型更快的去学习真实场景下的数据。除了姿势检测部分,整体模型还包含了一个pose tracker用来做跟踪。
 
如果在当前姿势检测器能够预测到下一帧中姿势位置的时候,姿势检测器就不会运行,会一直使用姿势追踪器的结果,否则就会运行检测器,并重新初始化追踪器。

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

研究人员最后在自己创建的数据集上,将自己的模型和OpenPose的做了比较,速度远超OpenPose精度略差。

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

研究人员开发了这种新的,在设备上单人特定的人体姿势估计模型,可以支持各种性能要求高的用例,例如手势,健身跟踪和AR。该模型在移动CPU上几乎实时工作,并且可以在移动GPU上加快超实时延迟。

33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别
    
研究人员表示,「即使参数数量较少,堆叠式沙漏架构也可以显着提高预测质量。我们在工作中扩展了这个想法,并使用编码器-解码器网络体系结构预测所有关节的热图,然后使用另一个编码器直接回归到所有关节的坐标。我们工作背后的关键点是可以在推理过程中丢弃热图分支,使其足够轻巧,可以在手机上运行。」

 项目介绍

参考链接:
https://arxiv.org/abs/2006.10204
https://www.arxiv-vanity.com/papers/2006.10204/


<pre style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;white-space: normal;font-family: -apple-system-font, system-ui, "Helvetica Neue", "PingFang SC", "Hiragino Sans GB", "Microsoft YaHei UI", "Microsoft YaHei", Arial, sans-serif;widows: 1;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="max-width: 100%;letter-spacing: 0.544px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section powered-by="xiumi.us" style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section style="margin-top: 15px;margin-bottom: 25px;max-width: 100%;opacity: 0.8;box-sizing: border-box !important;overflow-wrap: break-word !important;"><section><p style="margin-bottom: 15px;padding-right: 0em;padding-left: 0em;max-width: 100%;color: rgb(127, 127, 127);font-size: 12px;font-family: sans-serif;line-height: 25.5938px;letter-spacing: 3px;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(0, 0, 0);box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;font-family: 微软雅黑;caret-color: red;box-sizing: border-box !important;overflow-wrap: break-word !important;">为您推荐</span></strong></span></p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">看完青少年科技创新大赛名单,我自闭了</p><p style="margin-top: 5px;margin-bottom: 5px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">长尾分布下图像分类问题最新综述(2019-2020)</p><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">特朗普拿H1B签证开刀,LeCun吴恩达等实名谴责!</section><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;">数据分析入门常用的23个牛逼Pandas代码</section><section style="margin: 5px 8px;padding-right: 0em;padding-left: 0em;max-width: 100%;min-height: 1em;font-family: sans-serif;letter-spacing: 0px;opacity: 0.8;line-height: normal;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="color: rgb(87, 107, 149);font-size: 14px;">如何在科研论文中画出漂亮的插图?</span><br  /></section></section></section></section></section></section></section></section></section>
33个关键点——谷歌研究人员提出全新神经网络BlazePose,可健身跟踪、手语识别

本篇文章来源于: 深度学习这件小事

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写

发表评论

表情 格式 链接 私密 签到
扫一扫二维码分享