Python：Matplotlib - 多个数据集的概率图

2023-12-07

我有几个数据集（分布）如下：

set1 = [1,2,3,4,5]
set2 = [3,4,5,6,7]
set3 = [1,3,4,5,8]

如何使用上面的数据集绘制散点图，其中 y 轴是概率（即集合中分布的百分位数： 0%-100% ），x 轴是数据集名称？在 JMP 中，它称为“分位数图”。

Something like image attached: enter image description here

请各位赐教。谢谢。

[EDIT]

我的数据是 csv 格式的：

enter image description here

使用 JMP 分析工具，我可以绘制概率分布图（QQ 图/正态分位数图，如下图所示）：

enter image description here

我相信 Joe Kington 几乎已经解决了我的问题，但是我想知道如何将原始 csv 数据处理成概率或百分位数数组。

我这样做是为了在 Python 中自动进行一些统计分析，而不是依赖 JMP 进行绘图。

我不太清楚你想要什么，所以我猜，在这里......

您希望“概率/百分位数”值成为累积直方图？

那么对于一个单一的情节，你会有这样的东西吗？（如上面所示，用标记绘制它，而不是更传统的步骤图......）

import scipy.stats
import numpy as np
import matplotlib.pyplot as plt

# 100 values from a normal distribution with a std of 3 and a mean of 0.5
data = 3.0 * np.random.randn(100) + 0.5

counts, start, dx, _ = scipy.stats.cumfreq(data, numbins=20)
x = np.arange(counts.size) * dx + start

plt.plot(x, counts, 'ro')
plt.xlabel('Value')
plt.ylabel('Cumulative Frequency')

plt.show()

enter image description here

如果这大致就是您想要的单个图，则有多种方法可以在一个图形上绘制多个图。最简单的方法就是使用子图。

在这里，我们将生成一些数据集并将它们绘制在具有不同符号的不同子图上......

import itertools
import scipy.stats
import numpy as np
import matplotlib.pyplot as plt

# Generate some data... (Using a list to hold it so that the datasets don't 
# have to be the same length...)
numdatasets = 4
stds = np.random.randint(1, 10, size=numdatasets)
means = np.random.randint(-5, 5, size=numdatasets)
values = [std * np.random.randn(100) + mean for std, mean in zip(stds, means)]

# Set up several subplots
fig, axes = plt.subplots(nrows=1, ncols=numdatasets, figsize=(12,6))

# Set up some colors and markers to cycle through...
colors = itertools.cycle(['b', 'g', 'r', 'c', 'm', 'y', 'k'])
markers = itertools.cycle(['o', '^', 's', r'$\Phi$', 'h'])

# Now let's actually plot our data...
for ax, data, color, marker in zip(axes, values, colors, markers):
    counts, start, dx, _ = scipy.stats.cumfreq(data, numbins=20)
    x = np.arange(counts.size) * dx + start
    ax.plot(x, counts, color=color, marker=marker, 
            markersize=10, linestyle='none')

# Next we'll set the various labels...
axes[0].set_ylabel('Cumulative Frequency')
labels = ['This', 'That', 'The Other', 'And Another']
for ax, label in zip(axes, labels):
    ax.set_xlabel(label)

plt.show()

enter image description here

如果我们希望它看起来像一个连续的图，我们可以将子图挤压在一起并关闭一些边界。只需在调用之前添加以下内容即可plt.show()

# Because we want this to look like a continuous plot, we need to hide the
# boundaries (a.k.a. "spines") and yticks on most of the subplots
for ax in axes[1:]:
    ax.spines['left'].set_color('none')
    ax.spines['right'].set_color('none')
    ax.yaxis.set_ticks([])
axes[0].spines['right'].set_color('none')

# To reduce clutter, let's leave off the first and last x-ticks.
for ax in axes:
    xticks = ax.get_xticks()
    ax.set_xticks(xticks[1:-1])

# Now, we'll "scrunch" all of the subplots together, so that they look like one
fig.subplots_adjust(wspace=0)

enter image description here

无论如何，希望这能有所帮助！

编辑：如果您想要百分位值，而不是累积直方图（我真的不应该使用 100 作为样本大小！），这很容易做到。

只需做这样的事情（使用numpy.percentile而不是手动标准化事物）：

# Replacing the for loop from before...
plot_percentiles = range(0, 110, 10)
for ax, data, color, marker in zip(axes, values, colors, markers):
    x = np.percentile(data, plot_percentiles)
    ax.plot(x, plot_percentiles, color=color, marker=marker, 
            markersize=10, linestyle='none')

enter image description here

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

matplotlib

Probability

percentile

Python：Matplotlib - 多个数据集的概率图的相关文章

Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
将 C++ 指针作为参数传递给 Cython 函数

cdef extern from Foo h cdef cppclass Bar pass cdef class PyClass cdef Bar bar def cinit self Bar b bar b 这总是会给我类似的东西 Can
python array(10,1) 和 array(10,) 之间的区别

我正在尝试将 MNIST 数据集加载到数组中当我使用 X train y train X test y test mnist load data 我得到一个数组 y test 10000 但我希望它的形状为 10000 1 数组 1000
从 pyspark.sql 中的列表创建数据框

我完全陷入了有线的境地现在我有一个清单li li example data map lambda x get labeled prediction w x collect print li type li 输出就像 0 0 59 0 0
如何使用 matplotlib 在误差条图的尖端显示水平线？

我可以使用下面的代码生成误差条图代码生成的图表显示了代表错误的垂直线y 我希望在这些错误的尖端有水平线误差线但我不知道该怎么做 import numpy as np import matplotlib pyplot as plt x
使用 Pytest 的参数化添加测试功能的描述

当其中一个测试失败时可以在测试正在测试的内容的参数化中添加描述快速了解测试失败的原因有时您不知道测试失败的原因您必须查看代码通过每个测试的描述您就可以知道例如 pytest mark parametrize num1 num2
OpenCV 跟踪器：模型未在函数 init 中初始化

在视频的第一帧我运行一个对象检测器它返回对象的边界框如下所示
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
Jupyter 笔记本中未显示绘图图表

我已经尝试解决这个问题几个小时了我按照上面的步骤操作情节网站 https plot ly python getting started start plotting online并且图表仍然没有显示在笔记本中这是我的情节代码 color
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
使用 suds SOAP 库进行 HTTP 身份验证的奇怪行为

我有一个正在运行的 python 程序它使用 suds 通过 SOAP 获取大量数据 Web服务是通过分页功能实现的这样我就可以抓取nnn每个 fetch 调用的行并获取下一个nnn与后续的电话如果我使用如下代码向 HTTP 服务器进
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
PyQt5：如何使QThread返回数据到主线程

I am a PyQt 5 4 1 1初学者我的Python是3 4 3 这是我尝试遵循的many https mayaposch wordpress com 2011 11 01 how to really truly use qthr
将时间添加到日期时间

我有一个像这样的日期字符串然后使用strptime 所以就像这样 my time datetime datetime strptime 07 05 15 m d Y 现在我想添加 23 小时 59 分钟my time 我努力了 timed
Python 中的 Unix cat 函数 (cat * > merged.txt)？ [复制]

这个问题在这里已经有答案了一旦建立了目录有没有办法在Python中使用Unix中的cat函数或类似的函数我想将 files 1 3 合并到 merged txt 我通常会在 Unix 中找到该目录然后运行 cat gt merged
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

为什么这个文本区域不能在 Chrome 中采用其父级的完整高度？

考虑以下页面其中显示一行文本其中包含
Scala 反射中的线程安全与类型匹配

在 scala 2 11 12 JDK 1 8 0 131 中工作我已经能够使用以下代码复制在 Apache Spark 中观察到的线程安全错误其中我反复检查多个线程是否Option Int 可以通过匹配 lt lt to Option
针对 twitter bootstrap 按钮组的 jQuery 验证

我正在为我的 UI 使用 Twitter Bootstrap 并尝试在我的 Web 表单上使用 jQuery 验证在某些表单上我使用 btn group 来提供输入但我正在努力解决如何在以下 HTML 上使用 jQuery 验证 di
使用项目动态填充 WPF ListView 中的组合框

我有一个绑定到数据源的 WPF ListView 在 ListView 中是动态创建的 ComboBox 我想将其绑定到另一个数据源以提供项目但 SelectedIndex 来自第一个数据源请参见下面的 XAML 目前如果 Combo
如何以表格形式打印多个对象的参数？ [复制]

这个问题在这里已经有答案了我有一个对象列表我想在一个漂亮的表格中打印每个对象的参数我的代码在这里 class item object def init self thing owner color self thing thing s
AngularJs 从人类可读的日期获取时间戳

Angular JS 有没有办法从表单获取的日期获取时间戳
ContentEditable 元素对热键没有反应

我正在开发一个 Chrome 扩展它将 JS 代码注入所有打开的选项卡中该代码的任务包括显示一个文本框实现为contentEditable div 以允许格式化但是那contentEditableelement 与某些网站不能很好
从字符串中删除 \\u{e2} 字符

我复制了联系人的手机号码我得到的结果就像 8008708600 u e2 我想删除 u e2 来自字符串字符串是用我不想要的指数字符复制的例如 8008708600 u e2 所以期望的输出是8008708600 我使用了以下代码 l
如何捕捉可访问性焦点的变化？

我想捕捉可访问性焦点的变化我搜索并尝试过accessibilityElementDidBecomeFocused但光标改变后没有触发我想向按钮添加值并在光标更改后删除该值我的代码是这样的 override func viewDidL
$('#id').value 未定义

我在尝试检查字段的长度并根据结果设置值时遇到问题在 Firefox 中使用 firebug 我不断收到错误 elUsername 未定义请告诉我我做错了什么对 JQuery 相当陌生 usernameInput blur functi
将 Azure Function 发布为 NuGet 包（或从外部程序集加载函数）

我正在考虑将可重用的 Azure Functions 作为 NuGet 包发布以便在其他项目中轻松使用它这样我就可以在其他项目中引用NuGet包这样我就可以动态地组合一组要部署到 Azure Function 服务的 Azure Fu
如何在 Objective-C 中扫描字符串数组中的一组子字符串？

所以我基本上有一系列单词和短语其中一些包含诅咒我想创建一个方法来自动扫描数组中的每个单元以查找诅咒如果它没有诅咒请将其添加到新数组中我意识到我可以用一堆来做到这一点if else if声明和rangeOfString方法但令我震
从 git 存储库拉取时出现“致命：HTTP 请求失败”错误

在过去 4 年里我一直在 github 存储库中推送和提取文件没有出现任何问题两天前我尝试使用此后一直使用的相同命令从存储库中提取数据 git pull origin master但我不断收到错误 error while acces
为什么 Unsafe.fullFence() 不能确保我的示例中的可见性？

我正在尝试深入研究volatileJava 中的关键字和设置 2 测试环境我相信它们都使用 x86 64 并使用热点 Java version 1 8 0 232 CPU AMD Ryzen 7 8Core Java version 1
找到 Google Apps 脚本来终止它

我正在尝试谷歌脚本我只是从示例中复制代码以使用 Google 脚本创建 Google 文档但我忘记删除该脚本现在的问题是脚本向我发送了大量电子邮件并在我的帐户上创建文档我无法找到为我删除它的脚本 See 第 4096 期请求管理
为什么A | B 允许两者结合，我该如何防止呢？

我惊讶地发现 TypeScript 不会抱怨我做这样的事情 type sth value number data string value number note string const a sth value 7 data test c
如何在 Java 应用程序中添加文件浏览器？

我是 Java 编程新手正在构建一个应用程序该应用程序将添加显示和删除给定文件夹位置中的文件我已经使用 JFileChooser 添加了文件并且知道如何删除这些文件然而我被显示部分困住了我想在我的应用程序中使用不同的图标显示文
在 Fortran 90 中使用模块内部的子例程

我有一个关于在 Fortran 90 中的模块内使用子例程的问题这是我的代码 Module Multiplication Subroutine Two times input output Real input output output
Castle.Windsor 和 HttpContextWrapper

HttpContextWrapper 和 HttpContextBase 如在这里解释被引入是为了使 HttpContext 更加可模拟可测试我正在尝试使用它S arp 架构并遇到一些问题我的 MVC 控制器设置为在构造函数中接受
Python：Matplotlib - 多个数据集的概率图

我有几个数据集分布如下 set1 1 2 3 4 5 set2 3 4 5 6 7 set3 1 3 4 5 8 如何使用上面的数据集绘制散点图其中 y 轴是概率即集合中分布的百分位数 0 100 x 轴是数据集名称在 JMP 中

Python：Matplotlib - 多个数据集的概率图

Python：Matplotlib - 多个数据集的概率图 的相关文章

随机推荐

热门标签

Python：Matplotlib - 多个数据集的概率图的相关文章