如何在 python 中将最佳概率分布模型拟合到我的数据？

2024-05-15

我有大约 20,000 行这样的数据,

Id | value
1    30
2    3
3    22
..
n    27

我对我的数据进行了统计，平均值33.85，中位数30.99，最小值2.8，最大值206，95％置信区间0.21..所以大多数值在33左右，并且有一些异常值（一点点）..所以看起来像长尾分布。

我对发行版和 python 都很陌生，我尝试过 class fitterhttps://pypi.org/project/fitter/ https://pypi.org/project/fitter/尝试了 Scipy 包中的许多发行版，loglaplace 发行版显示了最低的错误（尽管不太理解它）。

我阅读了该线程中的几乎所有问题，并得出了两种方法（1）拟合分布模型，然后在模拟中绘制随机值（2）计算不同值组的频率，但该解决方案没有值例如超过206。

我的数据是值（数字），在 python 中拟合数据分布的最佳方法是什么，因为在我的模拟中我需要绘制数字。随机数必须与我的数据具有相同的模式。此外，我需要通过绘制数据和模型曲线来验证模型是否可以很好地呈现我的数据。

一种方法是根据贝叶斯信息准则（称为 BIC）选择最佳模型。 OpenTURNS 实现了一种自动选择方法（请参阅此处的文档 http://openturns.github.io/openturns/latest/user_manual/_generated/openturns.FittingTest_BestModelBIC.html).

假设你有一个数组x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]，这里有一个简单的例子：

import openturns as ot
# Define x as a Sample object. It is a sample of size 11 and dimension 1
sample = ot.Sample([[xi] for xi in x])

# define distributions you want to test on the sample
tested_distributions = [ot.WeibullMaxFactory(), ot.NormalFactory(), ot.UniformFactory()]

# find the best distribution according to BIC and print its parameters
best_model, best_bic = ot.FittingTest.BestModelBIC(sample, tested_distributions)
print(best_model)
>>> Uniform(a = -0.769231, b = 10.7692)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 python 中将最佳概率分布模型拟合到我的数据？的相关文章

如何在 pygame 中水平翻转图像？

这是在 pygame 如何翻转图像假设一个图像猪向右看时向左看我按向左箭头键然后保持这样即使我不按任何键或者按向上和向下箭头键那么当我按向右箭头键时如何再次将其切换回向右看并使其保持这种状态即使我不按任何键或按向上和向
采用迭代器而不是可迭代的方法[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案关于迭代器和可迭代对象仅是我的观察如果我错了请纠正我大多数构造函数数组类型将迭代器作为质量构造函数迭代器是显式创建的或
赋值运算符左/右侧的不同切片行为

作为一个来自 C 背景的 Python 新手 Python 3 4 x 中的切片运算符对我来说看起来很荒谬我只是不明白特殊规则背后的设计理念让我解释一下为什么我说它特别一方面根据 Stack Overflow 的回答here
如何使用 eval dataframe 方法在自定义函数中返回 numpy 数组或列表？

我正在使用 python 3 X 我正在尝试使用eval https pandas pydata org pandas docs stable generated pandas eval html pandas eval数据框方法包括这样
如何在自动模式下获取 pytest 夹具返回值？

我是新来学习 pytest 的在下面的示例代码中我怎样才能得到A 对象在test one夹具处于状态时的功能autouse mode import pytest import time class A def init self sel
使用魔法函数 %matplotlib inline

我试图看看使用之间的区别 matplotlib 内联并且没有这个声明但两次输出没有区别然后它有什么用 Output without matplotlib inline line Output with matplotlib inline
如何识别嵌套 json 文件并将其分解为数据框的列？

我再次重新组织我的问题以便更清楚我的数据看起来像这样 Research xmlns http www xml org 2013 2 XML language eng createDateTime 2022 03 25T10 12 39Z
为什么不能在 f 字符串中使用“await”？

为什么不能在 f 字符串中使用 await 有什么方法可以强制 f 字符串在协程函数的上下文中评估格式表达式吗 python3 Python 3 6 0 default Mar 4 2017 12 32 37 GCC 4 2 1 Compa
将 async-for 与 if 条件结合起来以中断中间等待的正确方法是什么？

如果我有一个协程正在消耗异步生成器中的项目那么从外部条件终止该循环的最佳方法是什么考虑到这一点 while not self shutdown event is set async with self external lib cl
向 Python 函数添加属性的最佳方法

以计算数学函数的 Python 函数为例 def func x a b c Return the value of the quadratic function ax 2 bx c return a x 2 b x c 假设我想以函数属性的
特别分发：应用程序安装失败

我已经为我尝试分发的应用程序创建了一个临时存档和一个 ipa 文件我还创建了一个分发配置文件其中包含我计划将应用程序分发到的设备的 UDID 当我将 ipa 和 mobileprovision 文件拖到 iTunes 中并尝试将应用程序
字符串中数字的连续相加

我是一名正在学习 python 的新程序员并且在如何完成此任务方面遇到了困难所以本质上我有一个从文件导入的数字字符串需要读取并且需要将第一个数字的总和添加到第二个数字并将其转换为正确的 ascii 字符因此例如如果我正在读取字符
使用 python3 查找表情符号的宽度

我尝试使用 python 中的模式打印字母 A def printA length height symbol a for i in range length for i in range height for i in range hei
使用 Pandas 来“applymap”来访问索引/列？

解决以下 pandas 问题的最有效方法是什么这是一个简化的示例其中包含数据框中的一些数据 import pandas as pd import numpy as np df pd DataFrame np random randint
数据帧中标志切换之间的行的总和/平均值

我有一个像这样的数据框 id power flag 0 20 0 1 25 0 2 26 1 3 30 1 4 18 0 5 30 0 6 19 0 7 21 1 8 23 0 我正在尝试获取行的平均值总和power柱子输出应该是这样的
如何获取 sklearn.metrics.classification_report 的输出作为字典？

我一直在尝试以字典的形式获得分类报告所以根据 scikit learn 0 20 文档我这样做 from sklearn import metrics rep metrics classification report y true y
boto3 资源（例如 DynamoDB.Table）的类型注释

The boto3库提供了几种返回资源的工厂方法例如 dynamo boto3 resource dynamodb Table os environ DYNAMODB TABLE 我想注释这些资源以便我可以获得更好的类型检查和完成但我
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
如何在 Python 3 中循环遍历集合，同时从集合中删除项目

这是我的情况我有一个list set 哪个并不重要 movieplayer我想调用的对象 preload 功能开启该预加载函数可以立即返回但希望将来返回一点我想存储这个电影播放器集合表明它们尚未预加载然后循环它们调用prel
PyMC3-自定义 theano Op 进行数值积分

我使用 PyMC3 进行参数估计使用必须定义的特定似然函数我用谷歌搜索了一下发现我应该使用densitydist实现用户定义的似然函数的方法但它不起作用如何在 PyMC3 中合并用户定义的似然函数并找出最大 aposteriori

随机推荐

将 sass 变量导入 gatsby 组件中引用的第二个 Sass 文件

我正在使用 Gatsby 构建一个静态站点项目我已经成功安装了 gatsby sass 插件并让 sass 正常工作但是我无法将自定义 sass 变量文件正确导入到其他组件 sass 文件中下面是我的文件夹结构 src compon
从 Firestore 获取值并使用异步将输出存储为全局

我正在尝试获取 firestore 数据然后将其存储在变量中 async function getchildContent Parent Message let count 0 var db firebase firestore var
Ubuntu 11.10 上的 c 数学链接器问题 [重复]

这个问题在这里已经有答案了我从 Ubuntu 升级后出现了一些奇怪的错误 10 11 11 04 i dont know 到 11 10 我正在得到一个undefined reference to sqrt 使用 math h 时并与 l
使用 data.table 进行分组并选择最短日期

My Data df1 lt structure list ID c A A A B B C c1 1 6 c2 1 6 myDate c 01 01 2015 02 02 2014 03 01 2014 09 09 2009 10 10
Jackson：将对象引用为属性

在我的 java spring 应用程序中我正在使用 hibernate 和 jpa 并使用 jackson 来填充数据库中的数据这是用户类 Data Entity public class User Id GeneratedValue
将 zip 从 Blazor WASM 应用程序上传到 AWS-S3 - 遵循教程，没有观察到错误，但存储桶中也没有文件

我有一个 Blazor WASM 应用程序即客户端用户可以向其中上传一些数据对数据进行一些完整性和安全性检查后我想将这些数据上传到 AWS S3 中的 zip 文件中目前我已经构建了 zip 文件如下所示 using var o
如何在 Python 3 中获取当前语言环境的字母表？

在 Python 2 中您可以执行以下操作来获取当前语言环境的字符集 import string print string letters 然而在 Python 3 中字符串模块的区域设置相关常量例如string letters s
流畅的 Hibernate 问题

我的实体中有这个 public virtual Iesi Collections Generic ISet
Spring Web应用程序在启动时从数据库初始化

Spring 3 1 汤姆猫我这里有一个设计问题数据库中已指定一组类别这些类别可以被认为是全局的因为它们可以在整个网络应用程序中使用我想做的是在服务器启动时读取这些类别并用 Java 填充某种类型的集合只需要在启动时从数据库读取
复制数据库的最佳方法是什么？

当我想要复制数据库时我总是创建一个新的空数据库然后将现有数据库的备份恢复到其中然而我想知道这是否真的是最不容易出错最不复杂且最有效的方法可以跳过创建空数据库的步骤您可以在恢复过程中创建新数据库这实际上是我所知道的克隆数据库最
爪哇;预期不是没有 if 的 else 语句

您好我想知道我的代码有什么问题我收到标题中所述的错误这有什么问题吗提前致谢为什么需要这么多细节我觉得我已经描述得足够好了 import java util Scanner public class CombinationLock
分支明显不同，但提交历史是相同的

git status告诉我我的分支和我在另一个存储库上开始的分支已经分歧 On branch master Your branch and origin master have diverged and have 13 and 13 dif
如何将字符串从 Applescript 传递到 Objective C

我正在开发一个应用程序我需要能够传递一个字符串变量 from 苹果脚本 to 目标C 我已经弄清楚如何从 Objective C 类中的方法运行 Applescript 但我需要能够将 NSString 设置为 Applescript 中
:target 伪类在 Firefox 中无法正常工作

我正在使用 target 伪类制作一个具有 CSS 灯箱类型效果的页面当您单击图像时会弹出一个包含信息的框当您单击任意位置时该框会再次消失它在 Chrome 和 IE 中运行良好但在 Firefox 中存在一个奇怪的错误当您将鼠
API 不会停止急切加载

我正在这里阅读文档 https api platform com docs core performance eager loading https api platform com docs core performance eager
Blazor 多个 _Host.cshtml

我希望有two Host cshtml 我的想法是我有一个登录页面其所需的 css 和 js 非常不同并且主仪表板页面也具有不同的所需 css 和 js 我不想在单个 Host 中加载所有这些 css 和 js cshtml 一个用
useEffect 中的 setTimeout 函数输出缓存的状态值

这很简单我正在使用 Redux 来管理我的状态我有一个setTimeout函数在一个useEffect功能 The setTimeout超时值为50000ms 我想要 SetTimeout 处理程序做什么 After 50000ms t
关于JSON和序列化的问题

我的视图模型有一个强类型视图其中包含一个对象 Person 和一个技能列表人是很直率的我像这样使用 Html Helpers Html TextBoxFor m gt m Person FirstName 我提交表格并得到我想要的问
自定义Visual Studio的项目上下文菜单

我正在使用带有一些加载项和扩展的 Visual Studio 2010 现在的问题是解决方案资源管理器中项目项的上下文菜单变得如此之大以至于我总是必须向下滚动才能找到我最常使用的属性和在 Windows 资源管理器中打开这变得非
如何在 python 中将最佳概率分布模型拟合到我的数据？

我有大约 20 000 行这样的数据 Id value 1 30 2 3 3 22 n 27 我对我的数据进行了统计平均值33 85 中位数30 99 最小值2 8 最大值206 95 置信区间0 21 所以大多数值在33左右并且有一些

如何在 python 中将最佳概率分布模型拟合到我的数据？

如何在 python 中将最佳概率分布模型拟合到我的数据？ 的相关文章

随机推荐

热门标签

如何在 python 中将最佳概率分布模型拟合到我的数据？的相关文章