如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？

2024-02-13

我尝试使用标准化数据高斯函数每个参数的正数和负数各2次dataset https://drive.google.com/file/d/1Llmc0UunCqocAgCHOp6MDL8uKYUWpdDO/view。数据集还包含缺失数据。问题是我想通过散点图突出显示异常值cmap='coolwarm'对于参数 A、B，特别是 T，使得：

该区间之外的异常值可以标记为(x) or (*) with cmap='coolwarm'
在图表的右侧cbar应该是可用的。
我的目标是在应用清洁数据之前以优雅的方式突出显示它们，然后比较原始数据和处理后的数据之前和之后的图表以一页中的子图的形式。

是否可以通过以下方式突出显示异常值from sklearn.neighbors import LocalOutlierFactor？或定义Vmin and Vmax从此得到启发answer https://stackoverflow.com/a/44652377/10452700或者我应该在突出显示之前标记异常值Boolean masking（为了学习）或定义函数来检测它们。我使用的代码对异常值进行着色，如下所示：

def normalize(value, min_value, max_value, min_norm, max_norm):
    new_value = ((max_norm - min_norm)*((value - min_value)/(max_value - min_value))) + min_norm
    return new_value

def outlier_fix(data, _min, _max):
    for i in range (0, data.size):
        if (data.iat[i] > _max):
            data.iat[i] = _max
        if (data.iat[i] < _min):
            data.iat[i] = _min
    return data

def createpositiveandnegativelist(listtocreate):
    l_negative = []
    l_positive = []
    for value in listtocreate:
        if (value <= 0):
            l_negative.append(value)
        elif (value > 0):
            l_positive.append(value)
    #print(t_negative)
    #print(t_positive)
    return l_negative,l_positive

def calculatemean(listtocalculate):
    return sum(listtocalculate)/len(listtocalculate)

def plotboundedCI(s, mu, sigma, lists):
    plt.figure()
    '''
    print("\nS:\n",s)
    print("\nmuuu:\n",mu)
    print("\nsigma:\n",sigma)
    '''
    count, bins, ignored = plt.hist(s,30,density=True)
    plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) * np.exp(-(bins-mu)**2/(2*sigma**2)),linewidth=2, color= 'r')
    #confidential interval calculation
    ci = scipy.stats.norm.interval(0.68, loc = mu, scale = sigma)
    #confidence interval for left line
    one_x12, one_y12 = [ci[0],ci[0]], [0,3]
    #confidence interval for right line
    two_x12, two_y12 = [ci[1],ci[1]], [0,3]
    '''
    print("\n\n\n",ci[0])
    print("\n\n\n",ci[1])
    '''
    plt.title("Gaussian 68% Confidence Interval", fontsize=12, color='black', loc='left', style='italic')
    plt.plot(one_x12, one_y12, two_x12, two_y12, marker = 'o')
    #plt.show()


    results = []
    for value in lists:
        if(ci[0]< value <ci[1]):
            results.append(value)
        else:
            #print("NOT WANTED: ",value)
            pass

    return results

df_orig = df.copy()
df_orig[df_orig == np.inf] = np.nan
df_orig[df_orig == -np.inf] = np.nan

def miss_contain_cycles(data):
    miss_cycles = []

    for i in range(math.ceil(data.shape[0] // 480)):
        temp = data[i*480:(i+1)*480]
        if np.sum(temp == np.inf) > 0 or np.sum(temp == -np.inf) > 0 or np.sum(np.isnan(temp)) > 0:
            miss_cycles.append(i)

    return miss_cycles

def missing_stats(data):
    inf_stats = np.sum(data == np.inf)
    minus_inf_stats = np.sum(data == -np.inf)
    nan_stats = np.sum(np.isnan(data))

    miss_cycles = miss_contain_cycles(data)

    return inf_stats, minus_inf_stats, nan_stats, miss_cycles


dft = pd.read_csv('me_300_SOF.csv', header=None)
df_plot.columns = ['A', 'B' ,'T','S','C','Cycle']

fig, ax = plt.subplots(nrows=3, ncols=1, figsize=(20,10), squeeze=False)

df_plot.plot.scatter(ax=ax[0, 0] , alpha=0.8 , x='Cycle', y='A', colormap='coolwarm', c='A') ; ax[0, 0].set_title('A Vs Cycle', fontweight='bold', fontsize=14) ; ax[0, 0].set_ylabel('A')
df_plot.plot.scatter(ax=ax[1, 0] , alpha=0.8 , x='Cycle', y='B', colormap='coolwarm', c='B') ; ax[1, 0].set_title('B Vs Cycle', fontweight='bold', fontsize=14) ; ax[1, 0].set_ylabel('B')
df_plot.plot.scatter(ax=ax[2, 0] , alpha=0.8 , x='Cycle', y='T', colormap='coolwarm', c='T') ; ax[2, 0].set_title('C Vs Cycle', fontweight='bold', fontsize=14) ; ax[2, 0].set_ylabel('T') 

plt.suptitle('Exploratory Data Analysis (EDA) ', color='yellow', backgroundcolor='black', fontsize=15, fontweight='bold')
plt.subplots_adjust(top=0.9, bottom=0.07, left=0.06, right=0.96, hspace=0.4, wspace=0.2)
plt.show()

任何帮助将不胜感激！

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

matplotlib

Seaborn

outliers

如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？的相关文章

无法在 virtualenv 中安装 libxml2

我有一个问题libxml2蟒蛇模块我正在尝试将其安装在python3 虚拟环境使用以下命令 pip install libxml2 python3 但它显示以下错误 Collecting libxml2 python3 Using cac
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
在linux上安装python ssl模块，无需重新编译

是否可以在已经安装了 OpenSSL 的 Linux 机器上安装 python 的 SSL 模块而无需重新编译 python 我希望它就像复制几个文件并将它们包含在库路径中一样简单 Python版本是2 4 3 谢谢是否可以在已经安装了
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
设置高亮大括号的 vim 颜色主题

如何更改突出显示大括号的 vim 配色方案我希望实际编辑 vim 主题文件以使更改永久生效问候克雷格匹配括号的自动高亮颜色称为MatchParen 您可以通过执行以下操作来更改 vimrc 中的颜色 highlight MatchP
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
数据框中 .map(str) 和 .astype(str) 有什么区别

我有一个数据框其列名为 col1 和 col2 的整数类型条目我想将 col1 和 col2 的条目以及其间的点连接起来我搜索并发现添加两个列条目 df col df col1 map str df col2 map str 并添
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
Python 属性和 Swig

我正在尝试使用 swig 为一些 C 代码创建 python 绑定我似乎遇到了一个问题试图从我拥有的一些访问器函数创建 python 属性方法如下 class Player public void entity Entity enti
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何在matplotlib中调整x轴

I have a graph like this x轴上的数据表示小时所以我希望x轴设置为0 24 48 72 而不是现在的值很难看到 0 100 之间的数据 fig1 plt figure ax fig1 add subplot 11
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
从迭代器外部将 StopIteration 发送到 for 循环

有几种方法可以打破一些嵌套循环他们是 1 使用中断继续 for x in xrange 10 for y in xrange 10 print x y if x y gt 50 break else continue only exec
如何展平解析树并存储在字符串中以进行进一步的字符串操作 python nltk

我正在尝试从树结构中获取扁平树如下所示我想将整个树放在一个字符串中就像没有检测到坏树错误一样 S NP SBJ NP DT The JJ high JJ seven day PP IN of NP DT the CD 400 NNS
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
如何创建用于霍夫曼编码和解码的树？

对于我的作业我将对霍夫曼树进行编码和解码我在创建树时遇到问题并且陷入困境不要介意打印语句它们只是让我测试并查看函数运行时的输出是什么对于第一个 for 循环我从主块中用于测试的文本文件中获取了所有值和索引在第二个 for 循
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
两种 ODE 求解器之间的差异

我想知道两者之间有什么区别ODEINT and solve ivp用于求解微分方程它们之间有什么优点和缺点 f1 solve ivp f 0 1 y0 y0 is the initial point f2 odeint f y0 0 1
使用 pandas 单元格中列表的长度选择行[重复]

这个问题在这里已经有答案了我有一张表 df a b c 1 x y x 2 x z c d 3 x t e f g 只是想知道如何使用 c 列的长度选择行 such as df loc len df c gt 1 我知道这是不对的正确的

随机推荐

delphi中如何获取appdata文件夹路径

如何获取appdata文件夹路径这是我的代码 begin Winexec PAnsichar appdata TEST exe sw show end 但不工作您不能将环境变量传递给WinExec 你必须先解决它们例如 uses Sy
为什么服务器不使用 C# 中的套接字接收本地传输中的所有 UDP 数据包？

我有一个服务器和一个客户端应用程序客户端将一堆数据包发送到服务器使用的协议是UDP 客户端应用程序生成一个新线程来循环发送数据包服务器应用程序还生成一个新线程来循环等待数据包这两个应用程序都需要根据传输进度保持 UI 更新如何正确
在建立安全 TLS 连接之前，客户端网络套接字已断开连接。如何在 Node js 中使用 Kafka JS 连接到 kafka 集群？

我获得的凭据我也有kafka keystore jks and kafka truststore jks host xxxxx xxxxx x cloudclusters net port xxxxx ip xxx xxx xxx xx
如何为 Google Closure 编译器自动生成外部程序

假设您正在处理具有多个外部库依赖项的 javascript 项目并且希望在 ADVANCED OPTIMIZATIONS 模式下使用 Google Closure 编译器来编译源代码由于在此模式下编译器将重命名对外部库对象和函数的代码
如何从 Tkinter 文本小部件获取输入？

如何从 Tkinter 获取输入Text widget EDIT 我问这个问题是为了帮助其他有同样问题的人 that这就是为什么没有示例代码的原因这个问题已经困扰了我几个小时我用这个问题来教导其他人 Please不要把它当作一个真正的问
Spring MVC 填充下拉列表的最佳方法 - 属性文件？

我想填充下拉列表但不想继续访问数据库我正在考虑将我的国家地区列表或语言列表放在属性文件中这样我就可以读入它然后将其分配给一个变量然后我可以通过 ModelAndView 类型返回它这是一个好方法吗我不知道如何存储静态数据我
ASP.net Identity 2.0 登录时未创建有效的身份验证

我在 ASP net 4 5 Web Forms 项目中实现 Microsoft 最新的 Identity 2 0 时遇到问题这是我的场景我已经下载了最新的 Webforms Samples 代码https aspnet codeple
在 qplot 中设置颜色标签并改变调色板

使用下面的代码我可以设置 x 和 y 轴的标签但无法设置颜色的标签cyl这里这文档 http 127 0 0 1 13246 library ggplot2 html qplot html没有提供任何解决办法 qplot mpg wt
php比较数组键，而不是值

我成功地使用了 array key exists 如 php net 所描述的 Example 但是去掉这些值它就不起作用了
使用角度反应形式进行信用卡验证

如何根据信用卡类型验证信用卡号我正在设计一个表单其中首先有两个字段是显示信用卡类型第二个用于信用卡号码如何根据信用卡类型验证信用卡号我了解定制validator申请于creditcardnumber字段并从regex 但是当用户更
ASP.NET C# 静态变量是全局的吗？

今天我发布了一个小型的asp net beta web应用程序允许内部员工修改一些产品信息我们开始遇到用户覆盖彼此产品信息的问题即使每个工作人员正在编辑完全不同的行产品在谷歌上进行一些搜索后我想我知道发生了什么它与静态变量的使
在 Android 上移植 C++ lib/app [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想将一些 C C 库移植到 Android 这有多可行例如OpenSSL可以移植吗或者假设一个依赖
空“key”参数错误

我正在使用 IReport 3 5 0 我的 java GWT 应用程序使用编译的 jasper 文件来创建报告我正在 java 应用程序中创建数据源并使用fillReport 报告填写方法它工作正常它填充了我在 jrxml 和 Ja
FBSDKSharePhoto 不使用 Swift 与照片共享链接

当我尝试同时通过 FBSDKSharePhoto 共享链接和图片时仅共享照片没有链接出现这是我使用的代码 let photo FBSDKSharePhoto FBSDKSharePhoto photo image self scale
Ruby 方法的大 O 表示法？

如何找到 Ruby 方法的复杂度例如length http www ruby doc org core 2 1 2 Array html 如果我查看源代码我会看到以下内容 static VALUE rb ary length VALUE
如何实现 Google 新材料设计指南中的“加载图像”模式（不透明度、曝光度和饱和度）

有没有人研究过实施加载图像 https material io archive guidelines patterns loading images html来自谷歌最新的材料设计指南的模式这是一种推荐的方式插图和照片可以在交错的持续时
git push 上出现“src refspec 不匹配”和“无法推送某些引用”错误[重复]

这个问题在这里已经有答案了可能的重复 git push 到 github 时出错 https stackoverflow com questions 959477 error when git push to github 我尝试推送我的
css 混合/模糊/合并背景图像

我在一个网站上工作这只是 ReactJS 中的一个演示 https poc b i o meteo netlify com https poc b i o meteo netlify com 问题出在背景上这个概念很简单该应用程序由
Android Q Kotlin - API 29：检查图像是否存在

这是我用来在 Android Q 中保存图像的代码 private var fileName private fun downloadImage val folderName Funny fileName bla dlImageURL sp
如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？

我尝试使用标准化数据高斯函数每个参数的正数和负数各2次dataset https drive google com file d 1Llmc0UunCqocAgCHOp6MDL8uKYUWpdDO view 数据集还包含缺失数据问题是我想

如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？

如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？ 的相关文章

随机推荐

热门标签

如何通过使用 cmap 的 Vmin 和 Vmax 的自定义范围来对散点图中的异常值进行着色或突出显示？的相关文章