焦点精选!论文解读 | DSC-PoseNet:通过双尺度一致性学习6DoF物体姿态估计
2023-05-19 11:29:54 来源: 哔哩哔哩
原创 | 文 BFT机器人
这篇论文是关于物体姿态估计的研究。
(资料图片仅供参考)
物体姿态估计的目标是通过相机获取一个物体的6个自由度(DoF),包括3D方向和3D平移。然而,由于物体可能会遭受各种光照变化和严重遮挡,从单个RGB图像中准确地估计姿态是非常具有挑战性的。
近年来,随着深度神经网络技术的发展,许多基于深度学习的姿态估计算法已经被提出并取得了很好的效果。
本文所遇到的难点是在没有真实姿态注释情况下训练RGB模型的性能问题。由于深度神经网络需要大量的真实图像进行训练,而标注3D物体姿态比标注2D图像更加困难,特别是当只提供RGB图像时。因此,缺乏准确的3D姿态注释可能会导致姿态估计方法性能严重下降。
为了解决这个问题,本文提出了一种新颖的两步物体姿态估计方法,并使用易于获取的2D边界框注释进行训练,从而显著提高了在没有真实姿态注释情况下训练的RGB模型性能。
01
该篇论文的创新点主要有两个:
1.提出了一种新的两步物体姿态估计方法,该方法只使用易于获取的2D边界框注释进行训练,可以在没有真实姿态监督的情况下进行训练以估计物体姿态,并且还提供了一种在没有3D姿态标签时涉及真实图像的解决方案。
2.提出了一种自监督双尺度姿态估计网络(DSC-PoseNet),通过构建可微分渲染器的跨尺度自监督来显著减轻合成数据和真实数据之间的领域差异。与其他基于RGB图像的物体姿态估计方法相比,DSC-PoseNet在性能上具有优势。
02
提出两步物体姿态估计方法:第一步是使用2D边界框进行弱监督分割。
该步骤的目标是从单个RGB图像中估计物体的姿态。具体来说,该算法使用DSC-PoseNet对真实图像进行裁剪和缩放,然后使用2D边界框进行弱监督分割。这意味着算法只需要2D边界框注释而不需要真实的3D姿态注释。
在这个步骤中,首先将真实图像裁剪并缩放到固定大小(480×640×3);
然后,使用2D边界框对物体进行分割。为了提高网络的性能,该算法还使用双尺度一致性和可见轮廓对齐自监督损失来训练网络。这种方法可以使网络学习到更加鲁棒的特征,并且可以在没有真实姿态注释的情况下进行训练。
此外,该算法还可以使用真实姿态注释进行训练。在这种情况下,算法会将真实姿态注释与2D边界框一起用于训练网络。这种方法可以进一步提高网络的性能,并且可以在有限数量的真实姿态注释情况下获得更好的结果。
总之,在第一步中,该算法使用2D边界框进行弱监督分割,并使用双尺度一致性和可见轮廓对齐自监督损失来训练网络。
此外,该算法还可以使用真实姿态注释进行训练。这种方法可以在没有真实姿态注释的情况下进行训练,并且可以在有限数量的真实姿态注释情况下获得更好。具体如图1左边所示。第二步是自监督关键点学习,它是DSC-PoseNet训练流程的一部分。该步骤旨在通过学习图像中的关键点来提高姿态估计的准确性。这个过程可以分为以下几个步骤:
首先,使用第一步中生成的伪标签和真实数据,将图像裁剪并调整大小以匹配网络输入大小。
然后,使用DSC-PoseNet对这些图像进行前向传递,并从输出中提取2D关键点。接下来,将这些关键点与伪掩模进行比较,并使用可微分PnP +渲染器对前景概率进行计算。这些前景概率被用于生成可见渲染和可见轮廓对齐。
最后,在训练过程中,使用双尺度一致性来强制执行关键点之间的空间一致性。这可以通过将2D关键点投影到3D空间并在不同尺度上重新投影回2D空间来实现。
图2展示了DSC-PoseNet网络如何预测物体中每个像素的关键点,并且如何使用注意力机制和加权平均来提高预测准确性。
总之,在第二步中,利用自监督学习方法来提高姿态估计的准确性。通过比较伪掩模和2D关键点,并使用双尺度一致性来强制执行空间一致性,可以获得更好的结果。具体如图1右边所示。
03
实验结果
图3描述了在Occluded LINEMOD数据集上的定性结果。其中,绿色代表真实姿态,红色代表未归一化尺度的预测结果,黄色代表归一化尺度的预测结果,蓝色代表通过对两种尺度预测出的关键点坐标进行平均得到的集成预测结果。
简单来说,这个图展示了DSC-PoseNet网络在Occluded LINEMOD数据集上的关键点坐标预测结果,并且比较了不同尺度下的预测效果。
表1展示了DSC-PoseNet网络在LINEMOD数据集上进行消融实验的结果,以评估不同模型组件对关键点学习和分割性能的影响。
04
结论
该篇论文提出了一种新的两步物体姿态估计方法,并显著提高了没有真实姿态注释的基于RGB的最先进模型的性能。
作者提出的姿态估计网络名为DSC-PoseNet,只使用易于获取的2D边界框注释进行训练。通过可见轮廓对齐和双尺度一致性自监督损失,DSC-PoseNet可以在没有真实姿态监督的情况下进行训练以估计物体姿态,并且还提供了一种在没有3D姿态标签时涉及真实图像的解决方案。
此外,尽管该网络是为未标记的真实图像设计的,但也可以使用真实姿态注释进行训练。网址:https://arxiv.org/abs/2104.03658v1标题:DSC-PoseNet: Learning 6DoF Object Pose Estimation via Dual-scale Consistency
更多精彩内容请关注公众号:BFT机器人本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。
标签:
为您推荐
精彩放送
热门文章
-
焦点热议:中兰环保:传闻深圳国资委入主收购中兰环保非属实
-
沐邦高科:邦宝益智“AI7教育编程机器人”项目启动 |微速讯
-
每日快看:航空装备板块震荡拉升,观典防务涨超11%
-
光峰科技回应网传车载产品有问题被厂家退货:信息不实 公司车载团队稳定、业务有序推进落地中 |世界新动态
-
张家胜任国家体育总局副局长
-
光通信概念股开盘下挫,震有科技跌超9% 每日观点
-
9股即将实施分红 和泰机电派现最大方
-
1只股票型ETF份额增加超2亿份,华安创业板50ETF增加2.62亿份 全球播资讯
-
黄金概念下挫 山东黄金等跌超4% 环球新资讯
-
AI应用方向开盘下挫 教育股领跌
-
机构:目前消费板块基本面呈现向好态势 行业将迎来更为确定的投资机会
-
南财研选快讯丨中信证券:运动鞋服持续复苏 长期维度仍是优质消费赛道 -全球观天下
精彩图片
-
成本大减!新一轮的旗舰大战也将在即将到来的9月正式拉开帷幕
-
博览会开幕 中国首款具有自主知识产权的国产通用型科学计算软件正式发布
-
技术下降!Intel独立显卡驱动一次评测就发现43个Bug
-
高性能的台式机彻底告别“光污染” 雷克沙推出简洁纯白外观设计
-
韩国媒体率先报道:三星电子236层NAND闪存预计年内开始生产 市场竞争更激烈
-
新科技!苹果正在积极研发某种形式的AR/VR头显或智能眼镜
-
谷歌测试开展新功能 向用户展示哪些云流媒体服务拥有特定的视频游戏
-
支付宝积极响应国家为小微降费的政策号召 一年降费让利近80亿
-
京东汽车就与浦林成山旗下新能源车轮胎品牌浦林达成战略合作 助力轮胎“电动化转型”
-
苹果新专利公布:暗示未来 iPhone手机或许有陶瓷材质版
-
盖茨和韩国能源供应商SK共同牵头 其中SK投资2.5亿美元
-
海底捞早已经捞不动了 据统计上半年最高亏损达2.97亿
热文
-
1-4月全国一般公共预算收入同比增长11.9% 专家:财税收支结构进一步优化平衡 每日快看
-
聚智合力打造跨界融合新舞台|天天播资讯
-
【热闻】山西“海归青年”姚文静:以创新理念推动传统产业转型升级
-
全球视点!民政部:对各地“520”当天是否开展婚姻登记服务不作统一规定
-
中科创达大模型研究成果亮相 -环球热议
-
焦点精选!鉴定机构和鉴定人是否要经过年审
-
优克联(UCL.US)Q1营收同比增长15.3% 同比扭亏为盈
-
普京:2022至2023年度俄谷物产品出口将达约6000万吨 _今日热门
-
华丽家族:目前主营业务为房地产开发 未来发展重心不变 -焦点热文
-
上海凤凰:江苏美乐的一致行动人累计增持1%股份 |天天热议
-
阿里巴巴2023年Q1调整后净利润273.8亿元 同比增长38%
-
长实集团:耗资约1810万港元回购40.35万股 _全球焦点
-
环球视讯!时刻互动顺利晋级创新层 加码AI研发
-
你可能不知道的事!《神奇四侠2015》竟然意外打破一项纪录
-
情人节是西方的还是中国传统节日_情人节是西方的节日吗
-
环球热文:中国人民银行副行长宣昌能出席欧洲复兴开发银行2023年年会
-
环球讯息:阿里巴巴2023年Q1调整后净利润273.8亿元,同比增长38%
-
华源控股:拟3000万元-6000万元回购股份 _世界速看
-
环球通讯!中国软件国际:斥资约2001万港元回购410.2万股
-
北京:推进推动人工智能发展取得变革性、颠覆性突破 _环球新消息
-
广州港:拟20亿元投建南沙国际港航中心项目 天天速递
-
凌云光:目前数字人产品正在与ChatGLM-130B和ChatGLM-6B做联合测试 焦点
-
当前快播:西南大学举办生物多样性展览 市民可于5月25日前观展
-
全球头条:沪郊发展优质大棚番茄:品种多达160多个
-
天天实时:直播打赏岂能沦为洗钱通道
-
硬件防毒技术 世界看点
-
基辛格称乌克兰加入北约符合俄乌双方利益,外交部:乌不应成大国对抗前沿 新资讯
-
每日聚焦:贝壳美股盘前一度涨近4%,公司一季度营收同比增长61.6%
-
2023世界机器人博览会将于8月17日至20日在京举办
-
华明装备:参与新加坡JTC光伏项目投标 _独家焦点
-
友邦保险:斥资约1.32亿港元回购165.84万股
-
快播:申通快递:4月快递服务业务收入同比增长53.81%
-
武汉都市田园综合体LOGO标识发布 环球今头条
-
成都大运会引入二手循环服务 转转黄炜:对标准体系再升级 当前关注
-
房地产商金科股份被强执12亿 金科股份被执行总金额超56亿
-
每日快看:经济洞察(第8期)|4月企业中长期贷款大增 居民存贷双收缩
-
欧科亿:1261.63万股限售股将于5月26日起解禁上市
-
“数码港元”先导计划启动 16家公司将进行首轮试验 |通讯
-
全球热讯:新华制药:缬沙坦氨氯地平片(I)获药品注册证书
-
厦门地铁3号线因偶发故障延误 现已排除
-
酒店好听的名字有哪些_酒店好听的名字
-
猪场批次化生产新工具!宁波第二激素厂“布舍林”“贝尔奇”盛大发布
-
中材国际:签订南方省水泥公司吉赞厂三号线工程总承包合同
-
葛兰再度增持恒瑞医药310万股 新消息
-
为什么3月7日是少女节_3月7日是少女节的来由
-
惊呆!纽约正在下沉?2900亿巨头旗下金矿遭炸弹袭击!一篇“小作文”引爆 这个板块涨疯了
-
世界观速讯丨上交所:关注到先正达集团转申报沪市主板的相关信息 尊重企业对上市板块的自主选择
-
微资讯!银华永丰债券基金限购
-
直播预告 | 520让爱滋润眼睛 中国干眼科普行·干眼科普访谈与您相约
-
全球快播:Stacklok获得1750万美元A轮融资