Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Python 中的隔离森林
我目前正在使用以下方法检测数据集中的异常值隔离森林 https scikit learn org stable modules generated sklearn ensemble IsolationForest html在 Python
python3x
scikitlearn
outliers
AnomalyDetection
数组中的离群值去除技术
我知道网上有大量用于异常值去除的资源 但我还没有设法获得我真正想要的东西 所以在这里发布 我有一个数组 或 DF 4列 现在我想根据列的异常值从 DF 中删除行 以下是我尝试过的 但并不完美 def outliers2 data2 m 4
python
pandas
NumPy
scipy
outliers
如何使用 ELKI 中的索引结构?
这些是报价形式http elki dbs ifi lmu de http elki dbs ifi lmu de 本质上 我们将抽象距离查询绑定到数据库 然后对该距离进行最近邻搜索 此时 ELKI 将自动选择最合适的 kNN 查询类 如果我
database
clusteranalysis
outliers
rtree
elki
如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示?
我尝试使用标准化数据高斯函数每个参数的正数和负数各2次dataset https drive google com file d 1Llmc0UunCqocAgCHOp6MDL8uKYUWpdDO view 数据集还包含缺失数据 问题是我想
python
pandas
matplotlib
Seaborn
outliers
MATLAB 中的统计异常值检测
假设我们有这个矩阵 main 10000 5 3 1 5 5677 0 134 1 1 456 3 该方法是计量经济学和统计问题中使用最广泛的方法 X是我们正在寻找异常值的数据 X mean X gt n std X 因此 如果这个不等式成
MATLAB
std
mean
outliers
Pandas:如何检测数据框中的峰值点(异常值)?
我有一个带有多个速度值的 pandas 数据框 这些速度值是连续移动的值 但它是传感器数据 因此我们经常在中间的某些点上出现错误 移动平均值似乎也没有帮助 所以我可以使用什么方法用于从数据中删除这些异常值或峰值点 Example data
python
python3x
pandas
outliers
如何重复格拉布斯检验并标记异常值
我想对一组数据重复应用格鲁布斯测试 直到它不再发现异常值 我希望标记异常值而不是删除异常值 以便我可以将数据绘制为直方图 其中异常值具有不同的颜色 我已使用异常值包中的 grubbs test 来手动识别异常值 但无法弄清楚如何循环它们并成
r
outliers
如何消除 Spotfire 箱形图中的异常值
提前感谢您的帮助 问候 拉杰 将值添加到MAX 即使可能 值也会扭曲数据 不过 有两种技巧可以做到这一点 右键单击 gt 属性 gt Y 轴 gt 设置MIN范围值和MAX将值范围设置为可以消除所有异常值的值 这实际上只适用于所有值都彼此接
max
min
Box
spotfire
outliers
如何删除R中箱线图中的异常值? [复制]
这个问题在这里已经有答案了 可能的重复 更改箱线图中的异常值规则 https stackoverflow com questions 4994313 changing the outlier rule in a boxplot 我需要使用箱
r
boxplot
outliers
使用 Python 删除字母图像中的残留物
我有一组图像 代表从单词图像中提取的字母 在某些图像中 有相邻字母的残留物 我想消除它们 但我不知道如何消除 一些样品 我正在使用 openCV 我尝试了两种方法 但都不起作用 使用 findContours def is contour
python
imageprocessing
opencv
outliers
使用 dplyr 创建一个具有滞后值作为数值向量的数据框
我的数据如下 data lt data frame A c 10 20 30 40 50 60 70 80 90 100 B c 110 120 130 140 150 160 170 180 190 200 我希望创建一个新列 按行从 A
r
dplyr
outliers
rankingfunctions
R、SOM、Kohonen 包、异常值检测
我用 SOM 做了一些实验 首先 我在 Python 中使用 MiniSOM 但没有留下深刻的印象 于是改用 R 中的 kohonen 包 它比以前提供了更多功能 基本上 我将 SOM 应用到三个用例 1 使用生成的数据进行二维聚类 2 使
r
outliers
som
使用 k 均值算法进行异常值检测
我希望你能帮助我解决我的问题 我正在尝试使用 kmeans 算法来检测异常值 首先 我执行算法并选择那些距聚类中心距离较远的对象作为可能的异常值 我不想使用绝对距离 而是想使用相对距离 即对象到聚类中心的绝对距离与聚类中所有对象到其聚类中心
r
kmeans
outliers
Python中基于移动均值的异常值检测
我正在尝试将算法从 MATLAB 转换为 Python 该算法适用于大型数据集 并且需要应用异常值检测和消除技术 在MATLAB代码中 我使用的异常值删除技术是移动中位数 Outlier T isoutlier Data raw Tempe
python
pandas
outliers
rollingcomputation
如何在 gnuplot 中对箱线图异常值进行分组
我有大量数据点 我尝试用箱线图绘制它们 但一些异常值是完全相同的值 并且它们表示在彼此旁边的一条线上 我发现如何设置gnuplot箱线图中异常值之间的水平距离 但这并没有太大帮助 因为这显然是不可能的 是否可以将异常值分组在一起 打印一个点
gnuplot
boxplot
outliers
从数据帧中删除单变量异常值(+-3 SD)
我对 R 很陌生 以至于我很难在其他人的问题中找到我需要的东西 我认为我的问题太简单了 以至于没有人费心去问 创建一个新数据框的最简单的代码是什么 该数据框排除单变量异常值的数据 我将其定义为距离其条件平均值 3 个 SD 的点 在其条件内
r
outliers
如何获取数据框箱线图中异常值的索引?
我有一个数据框 我想获取异常值索引的每一列 这是我的数据框的一部分 mediamarkt 48 1 7126 4012 3711 3237 3432 2671 2861 7065 3158 4023 4770 3861 13 4108 74
r
boxplot
outliers
热图上的特定异常值 - matplotlib
我正在生成一个带有固定离群值数据的热图 我需要将这些离群值显示为我使用的 热 cmap 调色板中的颜色 通过使用 cmap set bad green 和 np ma masked values data outlier 我得到了一个看起来
python
matplotlib
Heatmap
colorbar
outliers
如何去除 R 中的异常值?
我目前正在尝试以一种非常简单的方式删除 R 中的异常值 我知道您可以为此自行创建一些函数 但我想对这个简单的代码进行一些输入 以及为什么它似乎不起作用 outliers lt boxplot okt pris out okt no out
r
boxplot
outliers
删除异常值 (+/- 3 std) 并替换为 Python/pandas 中的 np.nan
我看到了几种接近解决我的问题的解决方案 link1 link2 但到目前为止 他们还没有帮助我取得成功 我相信以下解决方案是我所需要的 但仍然出现错误 并且我没有声誉点对其进行评论 提问 link 我收到以下错误 但我不明白在哪里 copy
python
GROUPING
outliers
1
2
»