前言
自动驾驶领域好像更为关注的是二维图像的物体检测,二维图像的语义特征比较丰富,对复杂特征有比较好的检测精度。现在比较流行的做法是,在二维图像上进行目标检测,后期结合雷达等测距信息,将二维数据映射到三维空间中。对语义特征比较复杂的情景,这种方式很有效,但是对一些比较简单的物体,基于三维点云方式的检测更精确。
基于三维点云的目标检测
传统方式:
主要步骤:分割地面->点云聚类->特征提取->分类。
基于深度学习的方式:
Frustum PointNets方式。
基于深度学习方式的挑战:
- 非结构化数据,只是一堆点xyzi,没有网格之类的组织结构。
- 无序性,相同的点云可以由多个完全不同的矩阵表示。
- 数量变化大:图像中像素数量是常数,点云的数量可能会有很大。
- 表现形式变化大:一辆车向左转,同一辆车向右转,会有不同的点云代表同一辆车。
- 缺少数据:没有图片数据多,扫描时通常被遮挡数据会有丢失