对 pcl::StatisticalOutlierRemoval 滤波器的理解
注:以下内容基于与 GPT-4 的交流并结合个人理解整理而成。若有描述不准确或模糊之处,欢迎指正。
参数配置
setMeanK
(int meanK):
此参数设置每个点要考虑的邻居数量,影响着计算点的局部平均距离。较大的
meanK
值可能包含更多的邻居,使滤波过程更加平滑,但可能降低移除离群点的能力。选择合适的
meanK
值取决于点云数据的密度和规模。例如,在稠密的点云中,较小的
meanK
值可能就足够了,而在稀疏的点云中,可能需要更大的
meanK
值来获得可靠的平均距离估计。
setStddevMulThresh
(double stddevMulThresh):
此参数定义了离群点的阈值,基于平均距离的标准差的倍数计算。较高的
stddevMulThresh
值意味着更宽松的离群点判断标准,可能保留更多的噪声点;较低的值则更严格,可能移除更多有效数据点。通常,开始时使用默认值(如 1.0),然后根据实际数据的噪声水平进行调整。
setNegative
(bool negative):
此布尔参数决定滤波器保留或排除检测到的离群点。若设置为
true
,滤波器将保留被标记为离群点的数据,移除其他点;若为
false
,则只保留非离群点。
setInputCloud
(const PointCloudConstPtr &cloud):
filter
(PointCloud &output):
虽然不是一个配置参数,但这个方法用于执行滤波操作。它应用上述设置的参数并产生滤波后的点云。
使用示例
# include <pcl/filters/statistical_outlier_removal.h>
// 移除统计离群值
pcl:: StatisticalOutlierRemoval< pcl:: PointXYZ> sor;
sor. setInputCloud ( parent_filtered_cloud) ;
sor. setMeanK ( 50 ) ;
sor. setStddevMulThresh ( 1.0 ) ;
sor. filter ( * parent_filtered_cloud) ;
执行逻辑
注: 这里离群点的去除, 去除的是
主点
, 如果一个
主点距离其最近的几个点的平均距离
与
整个点云的平均距离
相差较大, 则把这个
主点
抠掉
根据
setMeanK
的值为
每一个点
划分
群
(这个是我给这个过程起的名称)
例如有A1, A2, A3…An个点, MeanK=5, 那么假设距离每个点最近的点是序号邻近的点, 即距离A1最近的5个点是An-1, An, A2, A3, A4, 则这就是A1的群[An-1, An, A2, A3, A4], 同理A2的群为[An, A1, A3, A4, A5], 以此类推
计算每个群距离其
主点
(群的名称, 如A1, A2等)的平均距离
例如, A1, 群为[An-1, An, A2, A3, A4], 计算 每一个点距离A1的距离, 求均值, 得到 d1
A2, 群为[An, A1, A3, A4, A5], 计算 每一个点距离A2的距离, 求均值, 得到 d2, 以此类推
计算整个点云的平均距离及其标准差
d1到dn的平均值, 即为整个点云的平均距离, 记为 D
计算d1到dn的标准差
σ
平方和
:
∑
i
=
1
n
(
d
i
−
D
)
2
方差
:
1
n
∑
i
=
1
n
(
d
i
−
D
)
2
标准差
:
σ
=
1
n
∑
i
=
1
n
(
d
i
−
D
)
2
平方和: \sum_{i=1}^n (d_i - D)^2 \\ 方差: \frac{1}{n} \sum_{i=1}^n (d_i - D)^2 \\ 标准差: σ=\sqrt {\frac{1}{n} \sum_{i=1}^n (d_i - D)^2}
平方和
:
i
=
1
∑
n
(
d
i
−
D
)
2
方差
:
n
1
i
=
1
∑
n
(
d
i
−
D
)
2
标准差
:
σ
=
n
1
i
=
1
∑
n
(
d
i
−
D
)
2
根据
setStddevMulThresh
的值界定离群点, 假设, 该值为
μ
对于某个点 Am 有
d
m
>
D
+
μ
×
σ
d_m > D + μ ×σ
d
m
>
D
+
μ
×
σ
则Am为离群点, 将其去除
可以看到, 这里判断的是主点与整个点云之间是否存在异常现象, 即
不合群
, 整个点云平均距离是D, 平均也就差了一个标准差, 这个点Am跟邻近点的距离比这个大, 因此, 抠掉!
一点点细节
既然方差跟标准差描述的都是数据的离散程度, 为什么在这里选用的是标准差而不是方差?
单位统一
方差由于对原始数据进行了平方, 因此他的单位是原单位的平方, 比如在点云处理上, 单位是[m] 或者[cm], 而平方和处理之后, 单位就变成了 [m2] 或者[cm2], 这时对数据开根号, 可以保证单位一致
可以直接相加减
因为单位统一, 那么就可以直接在原始数据的基础上加减这个标准差, 来定义一个新的范围, 也正是因此划定了
离群
这一概念