使用叠加的 PDF 绘制直方图

2023-12-13

这是我之前几个问题的后续。这是我正在使用的代码：

import pandas as pd
import matplotlib.pyplot as plt
import scipy.stats as stats
import numpy as np
dictOne = {'Name':['First', 'Second', 'Third', 'Fourth', 'Fifth', 'Sixth', 'Seventh', 'Eighth', 'Ninth'],
           "A":[1, 2, -3, 4, 5, np.nan, 7, np.nan, 9],
           "B":[4, 5, 6, 5, 3, np.nan, 2, 9, 5],
           "C":[7, np.nan, 10, 5, 8, 6, 8, 2, 4]}
df2 = pd.DataFrame(dictOne)
column = 'B'
df2[df2[column] > -999].hist(column, alpha = 0.5)
param = stats.norm.fit(df2[column].dropna())   # Fit a normal distribution to the data
print(param)
pdf_fitted = stats.norm.pdf(df2[column], *param)
plt.plot(pdf_fitted, color = 'r')

I'm trying to make a histogram of the numbers in a single column in the dataframe -- I can do this -- but with an overlaid normal curve...something like the last graph on here. I'm trying to get it working on this toy example so that I can apply it to my much larger dataset for real. The code I've pasted above gives me this graph:

为什么不pdf_fitted与该图中的数据匹配吗？如何叠加正确的 PDF？

你应该用绘制直方图density=True如果您希望将其与真正的 PDF 进行比较。否则你的归一化（幅度）将会关闭。

此外，在绘制 pdf 时，您需要指定 x 值（作为有序数组）：

fig, ax = plt.subplots()

df2[df2[column] > -999].hist(column, alpha = 0.5, density=True, ax=ax)

param = stats.norm.fit(df2[column].dropna())
x = np.linspace(*df2[column].agg([min, max]), 100) # x-values

plt.plot(x, stats.norm.pdf(x, *param), color = 'r')
plt.show()

顺便说一句，使用直方图来比较连续变量与分布并不总是最好的。（您的样本数据是离散的，但链接使用连续变量）。箱的选择可能会混淆直方图的形状，这可能会导致错误的推断。相反，ECDF 是连续变量分布的更好（无选择）的说明：

def ECDF(data):
    n = sum(data.notnull())
    x = np.sort(data.dropna())
    y = np.arange(1, n+1) / n
    return x,y

fig, ax = plt.subplots()

plt.plot(*ECDF(df2.loc[df2[column] > -999, 'B']), marker='o')

param = stats.norm.fit(df2[column].dropna())
x = np.linspace(*df2[column].agg([min, max]), 100) # x-values

plt.plot(x, stats.norm.cdf(x, *param), color = 'r')
plt.show()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用叠加的 PDF 绘制直方图的相关文章

从终端调用时 uvicorn 不工作

我尝试通过 pip3 在系统上安装 uvicorn 这有效但是我无法从命令行运行相同的命令有关如何解决此问题的任何指示 Requirement already satisfied uvicorn in home vhawk19 loca
对 Python DataFrame 进行子集化

我正在从 R 过渡到 Python 我刚刚开始使用 Pandas 我有一个可以很好地子集化的 R 代码 k1 lt subset data Product p id Month lt mn Year yr select c Time Pro
Python 可以使用单独的媒体播放器打开 mp3 文件吗？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案是否可以开一个mp3Python 中的文件可以使用Popen 我并不是要在程序中运行它我的意思是作为媒体播放器中的一个单独窗口或其
Accel 无法在 gedit 3 插件中工作

我试图为 Gedit 3 编写一个使用 GObject 自省的小插件下面显示的代码的相关部分只是为了建立一个环境然后我可以将函数放入按钮的回调中但是该按钮的加速器不起作用这段代码有什么问题我正在使用教程here http www
Weasyprint 在调用 write_pdf 时获得未定义的属性：“AttributeError：‘PosixPath’对象没有属性‘read_text’”

我正在 ubuntu 18 04 上运行 weasyprint 项目并尝试创建一个 pdf 当我尝试设置页脚图像时问题就开始了我正在 python 3 6 7 上运行这是我调用 weasyprint 的代码 import sys i
int 对象在尝试对数字的数字求和时不可迭代？ [复制]

这个问题在这里已经有答案了我有这个代码 inp int input Enter a number for i in inp n n i print n 但它抛出一个错误 int object is not iterable 我想通过将每个
如何最好地将包含列表或元组的 Pandas 列提取到多个列中[重复]

这个问题在这里已经有答案了我不小心用错误重复的链接关闭了这个问题这是正确的 Pandas 将列表的列拆分为多列 https stackoverflow com questions 35491274 pandas split column
使用子图绘制 pandas 数据框 (subplots=True)：放置图例并使用紧凑的布局

我真的很喜欢 pandas 来处理和分析大数据集到目前为止我主要使用 matplotlib 进行绘图但现在想使用 pandas 自己的绘图功能基于 matplotlib 因为它需要更少的代码并且在大多数情况下对我来说似乎足够了尤
Python变量赋值问题

a b 0 1 while b lt 50 print b a b b a b 输出 1 2 4 8 16 32 wheras a b 0 1 while b lt 50 print b a b b a b 输出正确的斐波那契数列 1 1
Python 函数可能会引发哪些异常？ [复制]

这个问题在这里已经有答案了 Python 中有什么方法可以确定内置函数可能引发哪些异常例如文档 http docs python org lib built in funcs html http docs python org li
如何抑制 pyinstaller 生成的可执行文件窗口中的所有警告

我已经使用 pyinstaller 从 python 文件生成了可执行文件该程序按其应有的方式工作但在我想隐藏的窗口中出现了一条警告消息当 python 文件在 IDE 中运行时以下行会抑制所有警告消息 warnings filte
Cython：为什么 size_t 比 int 快？

更改某些 Cython 变量的类型int输入size t可以显着减少某些功能的时间 30 但我不明白为什么例如 cimport numpy as cnp import numpy as np def sum int cnp int64 t
为什么全新安装后会有pip和conda包？

All Windows 10 64 位 d l Anaconda 2 5 0 与 Python3 64 位并安装全新安装后我输入conda list 并且在软件包中我看到重复像 jupyter 1 0 0 py35 1 jupyte
如何将时间间隔划分为不同长度的部分？

我有一个从 0 到t 我想把这个区间分成一个以2 25 2 25 1 5为周期的累积序列方法如下 input start 0 stop 19 output sequence 0 2 25 4 5 6 8 25 10 5 12 14 25
避免在列表理解中计算相同的表达式两次[重复]

这个问题在这里已经有答案了我在列表理解中使用一个函数和一个 if 函数 new list f x for x in old list if f x 0 令我恼火的是这个表达f x 在每个循环中计算两次有没有办法以更清洁的方式做到这一点
Beautiful Soup 获取动态表数据

我有以下代码 url https www basketball reference com leagues NBA 2017 standings html all expanded standings html urlopen url so
检测图像是否损坏或损坏

我需要以编程方式检查用户在我的应用程序上选择作为壁纸的图像是否已损坏或损坏基本上我为用户提供了选择自己的图像作为壁纸的选项现在当图像加载时我只想检查它是否已损坏如果您正在寻找 PHP 解决方案而不是 javascript 解决方案
用于桌面数据库应用程序的 Python 框架

是否有一个框架可以为Python开发桌面数据库应用程序一些带有CRUD屏幕的屏幕我正在寻找类似于 Windows 窗体的东西能够将 TextField Combos 和其他 UI 隐喻与datasets连接到关系数据库例如 MySQL
python pandas如何在多个条件下过滤字符串

我有以下数据框 import pandas as pd data 5Star FiveStar five star fiv estar data pd DataFrame data columns columnName 当我尝试用一种条件
Python列表问题

我在使用 python 列表时遇到问题简化版本是 mylist1 some items in a list mylist2 mylist1 mylist1 pop i mylist insert i item print mylist1

随机推荐

当用户密码过期或“用户下次登录时必须更改密码”时如何检查 AD 用户凭据

我想知道是否有任何 Net 方法可以验证 Active Directory 用户凭据即使用户的密码已过期或用户设置了用户必须在下次登录时更改密码我已经尝试过PrincipalContext ValidateCredential 这对我
从 mysql 字符串列中去除数字/数字字符

我在 mysql 表中有一些列将人名存储为字符串和递增数字的组合以确保唯一性因此我将名称存储为 Patrick Patrick1 Patrick2 Patrick10 David David2 David5 如何仅检索字母名称本身而不
Java- Apache POI XSSF - 自定义 RGB Cellbackground 不起作用

我想为我的单元格背景颜色使用自定义 RGB 颜色 38 38 38 为此我使用以下代码 IndexedColorMap colorMap wb getStylesSource getIndexedColors XSSFColor cust
离开页面时弹出Js，但提交表单时不弹出

当用户尝试离开页面时我在网站上使用此代码在弹出窗口中显示警告消息然而这是一个带有表单的页面当用户提交表单时会出现没有意义的弹出窗口如何修改此代码以便仅当用户以各种可能的方式离开页面关闭选项卡单击站点徽标刷新页面时才出现
复制特定长度的字符

如何用特定字符如 make string 和长度 y 4 填充字符串结果为 yyyy 我知道在 C 中有类似的内容 fillstring 在 C 中也存在只需使用适当的构造函数 string text new string y 4
Bash 或 GoogleCL：字符串参数中的新行

嗨我正在使用GoogleCL 版本 0 9 11将视频上传到 Youtube 我的操作系统是 CentOS 5 5 和 Python 2 5 其中一个字符串参数包含换行符 n 无法正常显示 google youtube post vide
Jira Rest Java 客户端：缺少 Jersey 中的 ApacheHttpClientConfig

我正在关注JRJC教程第二行在这里 final JerseyJiraRestClientFactory factory new JerseyJiraRestClientFactory final JiraRestClient restCl
使用 Cocoapods 安装 Firestore

我正在尝试在我的项目中安装 firestore 当我尝试安装它时 Xcode 显示致命错误找不到模块映射文件 Users account Documents myapp Pods Headers Private openssl grpc
GKSession 对等点断开连接导致其他对等点显示为断开连接

我的应用程序使用 GKSession 和 GKSessionModePeer 它必须处理对等点的任意连接和断开连接因为这是一个长时间运行的应用程序用户应该能够进入后台并稍后返回这在大多数情况下都工作得很好但有时当对等方断开连接时
以编程方式关闭 GPS

我拥有的目前我的应用程序正在通过 GPS 提供位置我想要的是当我退出应用程序后 GPS 将自动关闭因为它不断地告诉我位置看起来很奇怪而且 GPS 消耗大量电池看看上面的评论线程似乎可以通过编程方式关闭 GPS 但只看到 12
如何在 WP7 上以编程方式打开/关闭 WiFi

我想知道是否有可能以编程方式打开和关闭 wifi 我的想法是有一个后台任务来查找地理坐标并切换 wifi 设置无论手机是否在以前保存的位置范围内然而我看到的所有应用程序都是获取 wifi 状态并快速跳转到 wifi 设置的应用程序我想
Visual Studio 2012 的注册表权限

在创建网络应用程序期间我收到以下弹出消息 Visual Studio没有权限从注册表读取模板信息这通常是由注册表权限问题引起的有人有解决办法吗请帮我我想看看 Visual Studio 的新功能 Thanks 这可能是一个很晚的答
如何更改 Java 中的日期格式？ [复制]

这个问题在这里已经有答案了我需要使用 Java 更改日期格式 dd MM yyyy to yyyy MM dd 如何使用从一种日期格式转换为另一种日期格式简单日期格式 final String OLD FORMAT dd MM yyyy
PHP 5.2 的 DateTime::diff() 有什么用处？

PHP 5 2 中是否有相当于 DateTime diff 的函数我的本地服务器是 PHP 5 3 并使用 DateTime diff 然后我发现我的实时站点使用 PHP 5 2 并给出错误 Fatal error Call to und
CKEditor - Webkit 浏览器中的编辑器宽度溢出

我发现工具栏不要在 WebKit 浏览器中自动换行 Safari Chrome 有一个三岁的虫子报告了 CKEditor 3 但它已关闭也许这就是一种回归我没有在我的配置中设置宽度我希望编辑器自动扩展到可用宽度编辑器位于一个div元
EF Core 2.0.0 一对一或零与 Fluent Api

在 Fluent Api 中EF 核心 2 0 0 没有任何方法HasRequired and HasOptional 我有两个模型人员和员工 public class Person public int Id get set publi
如何编写接口的junit测试？

为接口编写 junit 测试以便将它们用于具体的实现类的最佳方法是什么例如您有这个接口和实现类 public interface MyInterface Return the given value public boolean myMe
一种热编码映射

为了离散化分类特征我使用了 LabelEncoder 和 OneHotEncoder 我知道 LabelEncoder 按字母顺序映射数据但是 OneHotEncoder 如何映射数据我有一个熊猫数据框 dataFeat有 5 个不同
Eclipse 不接受集合排序

import java io BufferedReader import java util Collections import java io File import java io FileNotFoundException impo
使用叠加的 PDF 绘制直方图

这是我之前几个问题的后续这是我正在使用的代码 import pandas as pd import matplotlib pyplot as plt import scipy stats as stats import numpy as

使用叠加的 PDF 绘制直方图

使用叠加的 PDF 绘制直方图 的相关文章

随机推荐

热门标签

使用叠加的 PDF 绘制直方图的相关文章