当前位置:   找视频综合资讯网 > 军事 > 正文

CVPR 2020 目标检测论文精选

原标题:CVPR 2020 目标检测论文精选

CVPR 2020 目标检测论文精选

字幕组双语原文:CVPR 2020 目标检测论文精选

英语原文:CVPR 2020: The Top Object Detection Papers

翻译:雷锋字幕组

一、基于在点云上的3D目标检测的分层图形网络

原文标题:A Hierarchical Graph Network for 3D Object Detection on Point Clouds

这篇论文提出了一种基于图卷积(gconv)的三维目标检测层次图网络(hgnet)。这个网络通过处理原始点云,直接预测目标的3 d边界框。对于检测目标,HGNet能够捕捉这些点之间的关系并且使用多层次语义。

HGNet包含三个主要组件:

一个基于U型图卷积的网络(gu-net)

一个方案生成器

一个方案推理模块(ProRe Module) ----使用一个全连接层图表来推理方案

CVPR 2020 目标检测论文精选

作者提出一个注意形态的图卷积 (SA-GConv)去捕捉原始的形状特征。这是通过建立模型的相对几何位置来描述物体的形状。

CVPR 2020 目标检测论文精选

SA-GConv 基于u型网络捕捉多层次特征。然后映射到相同的特征空间的投票模块并且用于生成建议。在下一步中,GConv基于建议推理模块,利用方案来预测边框。

这里是在sun rgb-d v1数据集上获得的一些性能结果。  

CVPR 2020 目标检测论文精选

二、HVNET:基于激光雷达的3D目标检测的混合体素网络

原文标题:HVNet: Hybrid Voxel Network for LiDAR Based 3D Object Detection

这篇文章中使用的体素特征编码(VFE)包含3步:

体素化——将点云分配给2D体素网络

体素特征提取——计算和网络相关的点的特征,馈送到PointNet样式的功能编码器

投影——将逐点特征聚合到体素级特征并投影到其原始网格。这就形成了一个伪图像特征映射

CVPR 2020 目标检测论文精选

体素的大小在VFE方法中非常重要。较小的体素尺寸可以捕获更精细的几何特征。它们也更擅长对象本地化,但推理时间更长。使用较粗的体素可以获得更快的推理速度,因为这会导致较小的特征图。但是,它的性能较差。

作者提出了混合体素网络(HVNet),以实现细粒度体素功能的利用。它由三个步骤组成:

多尺度体素化-创建一组特征体素尺度并将它们分配给多个体素。

混合体素特征提取-计算每个比例的体素相关特征,并将其输入到关注特征编码器(AVFE)中。每个体素比例尺上的要素都是逐点连接的。

动态要素投影-通过创建一组多比例项目体素将要素投影回伪图像。

CVPR 2020 目标检测论文精选

 这是在KITTI数据集上的实验结果  

CVPR 2020 目标检测论文精选

三、Point-GNN:用于3D目标检测的点云图神经网络

原文标题:Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud

本文作者提供了图神将网络---Point-GNN---在LiDAR点云中检测物体。该网络预测了图中每个顶点所属对象的类别和形状。Point-GNN有一个自动回归机制,可以在一个输入中检测多个对象。

该方法由三个部分组成:

图构造:使用体素下采样点云进行图构造

一种T迭代的图形神经网络

边界框合并和得分

CVPR 2020 目标检测论文精选

以下是在KITTI数据集上获得的结果: