条形图的峰度、偏度？ - Python

2024-03-09

在Python中确定条形图的倾斜/峰度的有效方法是什么？考虑到条形图没有分箱（与直方图不同），这个问题没有多大意义，但我想做的是确定图的高度与距离（而不是频率与箱）的对称性。换句话说，给定沿距离（x）测量的高度（y）值，即

y = [6.18, 10.23, 33.15, 55.25, 84.19, 91.09, 106.6, 105.63, 114.26, 134.24, 137.44, 144.61, 143.14, 150.73, 156.44, 155.71, 145.88, 120.77, 99.81, 85.81, 55.81, 49.81, 37.81, 25.81, 5.81]
x = [0.03, 0.08, 0.14, 0.2, 0.25, 0.31, 0.36, 0.42, 0.48, 0.53, 0.59, 0.64, 0.7, 0.76, 0.81, 0.87, 0.92, 0.98, 1.04, 1.09, 1.15, 1.2, 1.26, 1.32, 1.37]

在距离 (x) 上测量的高度 (y) 分布（偏度）和峰值（峰度）的对称性是多少？偏度/峰度是否适合用于确定实际值的正态分布？或者 scipy/numpy 是否为这种类型的测量提供类似的东西？

我可以通过以下方式实现沿距离（x）分箱的高度（y）频率值的偏斜/峰度估计

freq=list(chain(*[[x_v]*int(round(y_v)) for x_v,y_v in zip(x,y)]))
x.extend([x[-1:][0]+x[0]])          #add one extra bin edge 
hist(freq,bins=x)
ylabel("Height Frequency")
xlabel("Distance(km) Bins")
print "Skewness,","Kurtosis:",stats.describe(freq)[4:]

Skewness, Kurtosis: (-0.019354300509997705, -0.7447085398785758)

在这种情况下，高度分布在中点距离周围是对称的（偏斜 0.02），其特征是峰态（-0.74 峰度，即宽）分布。

考虑到我将每次出现的 x 值乘以它们的高度 y 以创建频率，结果列表的大小有时会变得非常大。我想知道是否有更好的方法来解决这个问题？我想我总是可以尝试将数据集 y 标准化到大约 0 - 100 的范围，而不会丢失太多有关数据集偏斜/峰度的信息。

这不是一个Python问题，也不是一个真正的编程问题，但答案很简单。让我们首先考虑基于较低矩的更简单的值，而不是偏斜和峰度，mean http://en.wikipedia.org/wiki/Expected_value and 标准差 http://en.wikipedia.org/wiki/Standard_deviation。为了使其具体化并适应您的问题，我们假设您的数据如下所示：

X = 3, 3, 5, 5, 5, 7 = x1, x2, x3 ....

这将给出一个看起来像这样的“条形图”：

{3:2, 5:3, 7:1} = {k1:p1, k2:p2, k3:p3}

平均值 u 由下式给出

E[X] = (1/N) * (x1 + x2 + x3 + ...) = (1/N) * (3 + 3 + 5 + ...)

然而，我们的数据具有重复的值，因此可以重写为

E[X] = (1/N) * (p1*k1 + p2*k2 + ...) = (1/N) * (3*2 + 5*3 + 7*1)

下一项，标准开发，s，就是

sqrt(E[(X-u)^2]) = sqrt((1/N)*( (x1-u)^2 + (x2-u)^3 + ...))

但我们可以对E[(X-u)^2]术语并将其写为

E[(X-u)^2] = (1/N)*( p1*(k1-u)^2 + p2*(k2-u)^2 + ... )
           = (1/6)*( 2*(3-u)^2 + 3*(5-u)^2 + 1*(7-u)^2 )

这意味着我们不必拥有每个数据项的多个副本来进行求和正如你在问题中指出的。

The skew http://en.wikipedia.org/wiki/Skewness and kurtosis http://en.wikipedia.org/wiki/Kurtosis就这一点来说非常简单：

skew     = E[(x-u)^3] / (E[(x-u)^2])^(3/2)
kurtosis = ( E[(x-u)^4] / (E[(x-u)^2])^2 ) - 3

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

条形图的峰度、偏度？ - Python 的相关文章

如何将 Google Cloud Storage 中的许多文件设为私有？

我进行了很多研究但无法为此提出解决方案以下是我用来在 GCP 中公开所有文件的代码 def make blob public bucket name blob name Makes a blob publicly accessible
如何生成大型网站的图形站点地图[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想为我的网站生成图形站点地图据我所知有两个阶段抓取网站并分析链接关系提取树形结构生成视觉上
Pandas 在列级别连接数据帧时添加键

根据 Pandas 0 19 2 文档我可以提供keys参数来创建结果多索引 DataFrame 一个例子来自 pandas 文档是 result pd concat frames keys x y z 我将如何连接数据框以便我可以在
如何使用 python http.server 运行 CGI“hello world”

我使用的是 Windows 7 和 Python 3 4 3 我想在浏览器中运行这个简单的 helloworld py 文件 print Content Type text html print print print print h2 H
Colab 的使用限制持续多久？

当我对同一帐户的两个笔记本同时使用两个 GPU 约半小时后 Colab 已 12 小时未运行此消息不断弹出由于 Colab 中的使用限制您当前无法连接到 GPU 自从我上次使用 colab 以来已经过去了大约两个小时但该消息仍然弹出
在Python中清理属于不同语言的文本

我有一个文本集合其中的句子要么完全是英语印地语或马拉地语每个句子附加的 id 为 0 1 2 分别代表文本的语言无论任何语言的文本都可能有 HTML 标签标点符号等我可以使用下面的代码清理英语句子 import HTMLPars
从 Spark 数据帧中过滤大量 ID

我有一个大型数据框其格式类似于 ID Cat date 12 A 201602 14 B 201601 19 A 201608 12 F 201605 11 G 201603 我需要根据大约 500 万个 Is 的列表来过滤行最直接的方
如何在python mechanize中设置cookie

向服务器发送请求后 br open http xxxx br select form nr 0 br form MESSAGE 1 2 3 4 5 br submit 我得到了响应标题其中包含 set cookie Set Cookie
检查列表是否已排序的 Pythonic 方法

有没有一种Python式的方法来检查列表是否已经排序ASC or DESC listtimestamps 1 2 3 5 6 7 就像是isttimestamps isSorted 返回True or False 我想输入一些消息的时间戳列
如何不断地将 STDOUT 发送到我的 python TCP 服务器？

我有简单的 python echo 服务器它使用套接字并向客户端回显随机数我有另一个程序每 2 秒将值打印到标准输出如果它只是一个脚本我可以像这样重定向 stdout python script py 并像这样在脚本中获取它da
Python：绘制甘特图的模块

有没有一个好的Python绘图模块甘特图 http en wikipedia org wiki Gantt chart 我试过了开罗情节 http linil wordpress com 2008 09 16 cairoplot 11 但它
TypeError：“NoneType”对象不可下标[重复]

这个问题在这里已经有答案了错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进但仍然有错误我读到如果数据库中没有文件名记录变量名
在 Python 中将嵌套字典位置作为参数传递

如果我有一个嵌套字典我可以通过索引来获取键如下所示 gt gt gt d a b c gt gt gt d a b c 我可以将该索引作为函数参数传递吗 def get nested value d path a b return d
如何在自定义 django 命令中抽象出命令代码

我正在我的应用程序下编写自定义 django 命令management commands目录目前我在该目录中有 6 个不同的文件每个文件都有不同的命令来解决独特的需求然而有一些实用程序是它们所共有的抽象出这些公共代码的最佳方法是什
获取 python 模块的 2 个独立实例

我正在与以非 OO 方式编写的 python 2 x API 进行交互它使用模块全局范围来处理一些内部状态驱动的东西在它不再是单例的情况下需要它并且修改原始代码不是我们的不是一个选择如果不使用单独解释器的子进程运行有什么方法可
Django INSTALLED_APPS 的命名约定是如何工作的？

该网站上的教程创建了一个名为 polls 的应用程序它使用 django 1 9 所以在 INSTALLED APPS 中它是 polls apps PollsConfig 我正在观看一个教程他将应用程序命名为新闻通讯并且在 INST
python：xml.etree.ElementTree，删除“命名空间”

我喜欢 ElementTree 解析 xml 的方式特别是 Xpath 功能我有一个带有嵌套标签的应用程序的 xml 输出我想按名称访问此标签而不指定名称空间这可能吗例如 root findall molpro job 代替 ro
AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题这是我在js中的实现附加 iv 与加密消息并使用 base64 进行编码
具有重复值的 Sqlite 列

就说专栏吧aSQLite 数据库的非常重复始终有相同的 4 个值其他值可能稍后出现但不同值的数量将少于 1000 个 VALUES hello world it s a shame to store this str many tim
使用 python/scipy 进行 voronoi 和 lloyd 松弛

如何使用 Qhull 确定哪些 voronoi 单元按索引是正确的由现有顶点组成我正在尝试使用 LLoyds 算法和 scipy spatial Voronoi 它是 Qhull 的包装器生成的输入来执行约束松弛就代码而言

随机推荐

如何在堆栈导航器（react-navigation 2.X）中卸载以前安装的组件？

这是我的应用程序的简化流程 login 主页有彩色图表或创建图表的选项 colorInDiagram 用户为图表的各个部分着色付款主页返回主页现在在此之后如果用户决定再次为图表着色他她将从主页中选择该特定选项并且流程将照
此 NSPersistentStoreCoordinator 没有持久存储（架构不匹配或迁移失败）。无法执行保存操作

我正在开发一个使用 x x xcdatamodel 的应用程序现在在同一个 x x xcdatamodel 中我在其中一个实体中添加了一个属性应用程序崩溃显示消息此 NSPersistentStoreCoordinator 没有
为什么 int8_t 和用户通过 cin 输入显示奇怪的结果[重复]

这个问题在这里已经有答案了一小段代码让我发疯但希望你能阻止我跳出窗外看这里 include
在类声明/定义中包含标头

我知道你可以这样做 def h A int x A h class A public include def h A cpp A A x 0 int main A a return 0 我的问题是你为什么要这样做有什么优点吗我可以看到
flutter_bloc 库中的存储库提供程序在推送新路由时不提供存储库

我正在使用 flutter bloc 库来构建我的应用程序除了 BlocProvider 之外我还使用存储库提供程序因为我将在整个应用程序中广泛使用特定的存储库但我在上下文方面遇到了问题下面是我的代码片段主程序 dart voi
本地球拍

我正在书中阅读有关本地定义的内容并且遇到了这个例子 local define f x x 5 define g alon cond empty alon empty else cons f first alon g rest alon g
Web Platform Installer 3.0 中的“IIS 7 推荐配置”是什么？

今天刚安装了新的 IIS Express 看到 Web 平台安装程序也有安装 IIS 7 推荐配置的选项但我实际上无法弄清楚它的作用是什么有人用吗 quote site http forums iis net t 1174703 as
Python类实例变量隔离[重复]

这个问题在这里已经有答案了我是一名自学成才的程序员最近在学习Python 我遇到了一个奇怪的问题但我想这只是我不了解 python 语法和或程序流程的结果我有一堂课叫Test这是文件中的TestClass py class Tes
使用 AngularFire，是否可以创建关系型数据库？或者访问 UniqueID？

I saw 这个帖子 https www firebase com blog 2013 04 12 denormalizing is normal html在 Firebase 的博客上解释了使用其平台创建关系数据对象的最佳方法我正在努力
Chrome 扩展 - onRequest/sendRequest 与 onMessage/sendMessage [重复]

这个问题在这里已经有答案了退房这个示例扩展 http src chromium org viewvc chrome trunk src chrome common extensions docs examples api pageActi
如何完全销毁引导模式窗口？

我已经利用过模态窗口向导实现大约有 4 5 个步骤我需要在之后彻底摧毁它最后一步完成时和OnCancel 步骤无需刷新页面我当然可以隐藏它但是当我再次打开它时隐藏模式窗口会恢复所有内容有人能帮我解决这个问题吗谢谢任何提示
Tkinter 中的进度条，里面有一个标签

是否可以改进 Tkinter Python 中的进度条在中间添加标签例如读取文件我试图找到一个优雅的编码解决方案但没有真正的结果 from Tkinter import import ttk import tkFileDialog
Android 将 JSONArray 读入 JSONArray [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我如何读取包含 json 数组的 json 数组这是我的 json product name myApp config grade
selenium 的 PageFactory 类及其与 FindBy Annotation 一起使用时的工作方式

我有一个问题当我使用 FindBy 注释时 Selenium webdriver 的 PageFactory initElements 方法如何工作我有一段这样的代码 Class PageObject FindBy id usernam
调整 UIAlertView 内 UIPickerView 的大小

我想放一个UIPickerView in a UIAlertView但我似乎无法正确调整它的大小这是我得到的这是我的代码 let alertView UIAlertController title Select item from li
Javascript - 异步调用后同步

我有一个 Javascript 对象需要 2 次调用外部服务器来构建其内容并执行任何有意义的操作该对象的构建使得实例化它的实例将自动进行这两个调用这两个调用共享一个公共回调函数该函数对返回的数据进行操作然后调用另一个方法问题是在
Angular Bootstrap 在 Angular 13 项目上给出错误

我正在尝试安装角度引导程序 https ng bootstrap github io home在我的 Angular 13 项目中如下所示 ng 添加 ng bootstrap ng bootstrap 但是当我在此语句上按 Y 时我立
如何在 Ektron 中选择属于某个分类的库项目

我使用的是 Ektron CMS 版本 8 5 SP2 我有一些分类项目有些是实际页面有些是库项目 Word 文件和 PDF 等文档假设我的分类中有 3 个页面和 2 个库项目总共 5 个项目我使用以下代码 ContentMana
CakePHP 2.0 $this->表单->input()

这是我的add tcp 表名称组表字段 group id group desc PK group id 这是我的控制器 class GroupsController extends AppController public helper
条形图的峰度、偏度？ - Python

在Python中确定条形图的倾斜峰度的有效方法是什么考虑到条形图没有分箱与直方图不同这个问题没有多大意义但我想做的是确定图的高度与距离而不是频率与箱的对称性换句话说给定沿距离 x 测量的高度 y 值即 y 6 18 10

条形图的峰度、偏度？ - Python

条形图的峰度、偏度？ - Python 的相关文章

随机推荐

热门标签