传感器图 https://i.stack.imgur.com/OahnS.png
我对包含 8 个电极的传感器进行了实验。
上图是电极输出与时间的关系图。
正如您在图中看到的,8 个电极之一显然是异常值(可能是由于某些电气故障)。
该图是从 Pandas DataFrame 生成的,该数据框基本上有 10 列(1 列表示时间,8 列表示电极,1 列表示 8 个电极的平均值)。
统计检测其中一列是否为异常值的最佳方法是什么?我想异常值列可以从数据框中删除。
Thanks!
散点图或分布图非常适合指出异常值。但在熊猫数据框的问题上,我将如何做到这一点。
df.decribe()
将为您提供一个良好的平均值、最大值和所有百分位矩阵。查看列的最大值,如果其大于值的 75%,则指出异常值。
Then df['Sensor Value'].value_counts()
应该给你值的频率。您将在此处显示具有较大值和较低频率的异常值。
获取他们的索引并使用删除它们df.drop(indexes_list, inplace=True)
EDIT:
您还可以检查异常值mean +/- 3 * standard deviation
.
示例代码:
outliers = df[df[col] > df[col].mean() + 3 * df[col].std()]
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)