介绍一下本文做三维物体识别的思路,如何用上PointNet和PointNet++ 结合2D和3D的优点,针对RGB-D的input,先在RGB的图片上用一个2D detectors得到一个二维的物体区域。比如图片中的车先得到一个红色的方框,得到二维的区域之后,大部分任务我们知道camera intreseace,那么由二维区域生成到一个三维的视锥区域(2D region (from CNN) to 3D frustum),右边红色的锥状体表示。接下来对物体的搜索就可以在这是视锥内搜索,而且可以转化为在三维点云中搜索的问题。 这么做的优点在于: