在 matplotlib 中绘制时，正态分布显得过于密集

2024-03-04

我正在尝试估计数据的概率密度函数。就我而言，数据是形状为 8200 x 8100 的卫星图像。下面，我向您展示 PDF 的代码（函数“is_outlier”是由在此发布此代码的人借用的）。正如我们所看到的，图 1 中的 PDF 过于密集。我想，这是由于卫星图像由数千个像素组成。这是非常丑陋的。

我的问题是，如何绘制不太密集的 PDF？例如，如图 2 所示。

lst = 'satellite_img.tif' #import the image
lst_flat = lst.flatten() #create 1D array

#the function below removes the outliers
def is_outlier(points, thres=3.5):

    if len(points.shape) == 1:
        points = points[:,None]
    median = np.median(points, axis=0)
    diff = np.sum((points - median)**2, axis=-1)
    diff = np.sqrt(diff)
    med_abs_deviation = np.median(diff)

    modified_z_score = 0.6745 * diff / med_abs_deviation

    return modified_z_score > thres


lst_flat = np.r_[lst_flat]
lst_flat_filtered = lst_flat[~is_outlier(lst_flat)]
fit = stats.norm.pdf(lst_flat_filtered, np.mean(lst_flat_filtered), np.std(lst_flat_filtered))

plt.plot(lst_flat_filtered, fit)
plt.hist(lst_flat_filtered, bins=30, normed=True)
plt.show()

figure 1

figure 2

问题在于 PDF 图中的 x 值未排序，因此绘制的线在随机点之间来回移动，从而造成您看到的混乱。

两种选择：

不要绘制线，只绘制点（如果你有很多点，那就不太好，但会确认我上面所说的是否正确）：
```
plt.plot(lst_flat_filtered, fit, 'bo')
```

排序lst_flat_filtered计算 PDF 并绘制它之前的数组：

lst_flat = np.r_[lst_flat]
lst_flat_filtered = np.sort(lst_flat[~is_outlier(lst_flat)])  # Changed this line
fit = stats.norm.pdf(lst_flat_filtered, np.mean(lst_flat_filtered), np.std(lst_flat_filtered))

plt.plot(lst_flat_filtered, fit)

以下是一些显示这些行为的最小示例：

重现您的问题：

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

lst_flat_filtered = np.random.normal(7, 5, 1000)

fit = stats.norm.pdf(lst_flat_filtered, np.mean(lst_flat_filtered), np.std(lst_flat_filtered))

plt.hist(lst_flat_filtered, bins=30, normed=True)

plt.plot(lst_flat_filtered, fit)

plt.show()

标绘点

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

lst_flat_filtered = np.random.normal(7, 5, 1000)

fit = stats.norm.pdf(lst_flat_filtered, np.mean(lst_flat_filtered), np.std(lst_flat_filtered))

plt.hist(lst_flat_filtered, bins=30, normed=True)

plt.plot(lst_flat_filtered, fit, 'bo')

plt.show()

对数据进行排序

import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt

lst_flat_filtered = np.sort(np.random.normal(7, 5, 1000))

fit = stats.norm.pdf(lst_flat_filtered, np.mean(lst_flat_filtered), np.std(lst_flat_filtered))

plt.hist(lst_flat_filtered, bins=30, normed=True)

plt.plot(lst_flat_filtered, fit)

plt.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

matplotlib

plot

statistics

在 matplotlib 中绘制时，正态分布显得过于密集的相关文章

使用 django-rest-framework 设置对象级权限

尝试使用 django rest framework 最干净最规范地管理 django guardian 对象级权限我想将对象的读取权限 module view object 分配给在执行 POST 时发出请求的用户我的基于阶级的观点
将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
在 python pandas 中，如何保存“网格图”？

我对 pandas 绘图工具很陌生在文档中以下命令非常方便 myplot rts ret hist bins 50 by rts primary mic 然而当我尝试从图中获取图形参考并保存它时问题就出现了 myfigure myp
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
python 中的 <> 运算符有什么作用？

我刚刚遇到这个here http www feedparser org feedparser py 总是这样使用 if string1 find string2 lt gt 1 pass 什么是 lt gt 运算符这样做为什么不使用通常的
Paste.httpserver 并通过 HTTP/1.1 Keep-alive 减慢速度；使用 httperf 和 ab 进行测试

我有一个基于paste httpserver 的Web 服务器作为HTTP 和WSGI 之间的适配器当我使用 httperf 进行性能测量时如果每次使用 num conn 启动一个新请求我每秒可以执行超过 1 000 个请求如果我使
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
Plotly：如何检查基本图形结构（版本 4）

对于旧版本的plotly 例如在 Jupyterlab 中您可以简单地运行figure像这样检查你的图形的基础知识 Ouput data marker color red size 10 symbol 104 mode markers l
从 Flask 运行 NPM 构建

我有一个 React 前端我想在与我的 python 后端 API 相同的源上提供服务我正在尝试使用 Flask 来实现此目的但我遇到了 Flask 找不到我的静态文件的问题我的前端构建是用生成的npm run build in s
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
给定一个排序数组，就地删除重复项，使每个元素仅出现一次并返回新长度

完整的问题我开始在线学习 python 但对这个标记为简单的问题有疑问给定一个排序数组就地删除重复项使得每个元素只出现一次并返回新的长度不分配另一个数组的额外空间您必须通过修改输入来完成此操作数组就地具有 O 1 额外内
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
pandas 中数据帧中的随机/洗牌行

我目前正在尝试找到一种方法来按行随机化数据框中的项目我在 pandas 中按列洗牌排列找到了这个线程在 pandas 中对 DataFrame 进行改组排列 https stackoverflow com questions 157
将 Keras 集成到 SKLearn 管道？

我有一个 sklearn 管道对异构数据类型布尔分类数字文本执行特征工程并想尝试使用神经网络作为我的学习算法来拟合模型我遇到了输入数据形状的一些问题我想知道我想做的事情是否可能或者我是否应该尝试不同的方法我尝试了几种不
python从二进制文件中读取16字节长的双精度值

我找到了蟒蛇struct unpack 读取其他程序生成的二进制数据非常方便问题如何阅读16 字节长双精度数出二进制文件以下 C 代码将 1 01 写入二进制文件三次分别使用 4 字节浮点型 8 字节双精度型和 16 字节长双精度型
如何（安全）将 Python 对象发送到我的 Flask API？

我目前正在尝试构建一个 Flask Web API 它能够在 POST 请求中接收 python 对象我使用 Python 3 7 1 创建请求使用 Python 2 7 运行 API 该 API 设置为在我的本地计算机上运行我试图发
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

通过 Android API 配置 Exchange 电子邮件帐户

我想编写一个应用程序给定用户名和密码它将除其他外在设备上配置交换电子邮件电子邮件帐户可以通过Android API 来实现吗如果是这样通过什么班级在 3 0 之前的版本中有一种通过额外传递用户名和密码来配置交换电子邮件的方
sklearn 中的 2D KDE 带宽与 scipy 中的带宽之间的关系

我正在尝试比较性能sklearn neighbors KernelDensity http scikit learn org stable modules generated sklearn neighbors KernelDensity
使用 imagemagick 中的颜色列表重新映射/分离图像颜色

假设我有这个图像我想将颜色数量减少到 3 种如下所示为此我应用了以下命令 convert orange jpg remap palette png orange output png where palette png looks
Postgres spring boot R2dbc 应用程序中缺少 DatabaseClient

我出现以下错误 Exception Error creating bean with name inventoryService defined in URL jar file app jar BOOT INF classes com ep
使用 Passport 对 API 端点进行身份验证

继couple https thinkster io mean stack tutorial adding authentication via passport 教程 https auth0 com blog 2014 01 07 ang
在 VSCode 中的 .ipynb markdown 中创建新命令

我正在尝试在 VSCode 中的 ipython 笔记本文件中创建用于 markdown 的新命令但这样做时遇到问题 This https stackoverflow com questions 65864550 how to defin
scikit-image 将图像保存到字节串

我在用着scikit 图像 http scikit image org 读取图像 img skimage io imread filename 做了一些操作后img 我想将其保存到内存中的文件 laStringIO http docs py
如何在 Google 折线图中按年份分隔日期

我有一份清单dates values我喜欢显示在谷歌图表折线图 https developers google com chart interactive docs gallery linechart data addRows new D
在 GSP 上将 JSON 发送到 javascript

我正在使用 Grails 2 3 7 并且控制器操作如下 def testData def result result name Sales result type bar result data 5 20 45 10 10 20 data
CSS3在IE8上奇偶行不同颜色

我有 Css 代码用于通过不同颜色区分奇数行和偶数行 historyLog tr nth child odd td background color blue historyLog tr odd td background color bl
一起使用 Jade 和 Handlebars 并进行相应渲染

我试图了解如何包含玉和把手就像我试图将 Angular js 添加到我的服务器一样该服务器也使用玉来服务其他网页我听说过 consolidate js 这是我的 app js 代码 var engines require consol
Hibernate：insertable = false，updatable = false属于涉及外键的复合主键星座中的什么位置？

在 Hibernate 或其他 ORM 中实现复合主键时在使用标识关系作为 PK 一部分的 FK 的复合主键星座中最多可以在三个位置放置 insertable false updatable false 进入复合 PK 类的 Colu
（总是）在使用加密来验证用户身份时向美国当局报告？

这可能不是一个直接的代码问题但这是一个经常出现的问题我发现阅读起来非常有用 App Store 帮助回答缺少合规性使用 Expo Firebase https stackoverflow com questions 63613197
使用 PHP cUrl 发送后解码 JSON

我到处研究过但无法弄清楚这一点我正在编写一个测试 cUrl 请求来测试我的 REST 服务 initialize curl handler ch curl init data array products gt array produc
从渲染器接收消息超时：600.000 当我们使用 Jenkins windows 服务模式执行 selenium 脚本时

我们每天都使用 jenkins 窗口服务无头模式执行我们的 selenium 自动化脚本直到昨天它都工作正常突然它停止工作并且无法启动浏览器它显示以下错误消息 15536 77874 187 严重从渲染器接收消息超时 600 0
H2 in-mem-DB 与 hibernate 设置为创建给我表未找到错误

我想在内存数据库中建立一个包含 hibernate spring mvc 和 H2 的项目目前当一切启动在码头时我收到错误消息指出表格尚未存在这是我得到的错误 Okt 09 2013 3 42 47 PM org hibern
解压错误：GZip 标头中的幻数不正确

我是新来的系统 IO 压缩 https msdn microsoft com en us library system io compression v vs 110 aspx 我正在尝试压缩和解压缩一些信息对于压缩我使用代码项目 htt
休眠中的 PreInsert 和 PreUpdate 事件监听器

我用过PreInsertEventListener and PreUpdateEventListener用于在表中插入创建日期和更新日期的事件侦听器我面临的问题是当我将实体保存在数据库中时创建日期无法插入表中与更新记录时插入更新日期
如何发送包含在 include_bytes! 中的文件？作为铁反应？

我正在尝试发送包含在二进制文件中的文件include bytes 在 Iron 应用程序中我希望我的应用程序最终得到一个文件它只需要很少的 HTML CSS 和 JS 文件这是我正在摆弄的一个小测试设置 extern crate ir
在 matplotlib 中绘制时，正态分布显得过于密集

我正在尝试估计数据的概率密度函数就我而言数据是形状为 8200 x 8100 的卫星图像下面我向您展示 PDF 的代码函数 is outlier 是由在此发布此代码的人借用的正如我们所看到的图 1 中的 PDF 过于密集我想

在 matplotlib 中绘制时，正态分布显得过于密集

重现您的问题：

标绘点

对数据进行排序

在 matplotlib 中绘制时，正态分布显得过于密集 的相关文章

随机推荐

热门标签

在 matplotlib 中绘制时，正态分布显得过于密集的相关文章