解释 scipy.stats.entropy 值

2024-05-08

我正在尝试使用scipy.stats.熵来估计库尔巴克-莱布勒(KL) 两个分布之间的散度。更具体地说，我想使用 KL 作为衡量标准来确定两个分布的一致性。

但是，我无法解释 KL 值。例如：

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(-2.5,0.1,1000)

scipy.stats.熵(t1,t2)

0.0015539217193737955

Then,

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(2.5,0.1,1000)

scipy.stats.熵(t1,t2)

= 0.0015908295787942181

基本上没有重叠的完全不同的分布怎么可能有相同的KL值呢？

t1=numpy.random.normal(-2.5,0.1,1000)

t2=numpy.random.normal(25.,0.1,1000)

scipy.stats.熵(t1,t2)

= 0.00081111364805590595

这个给出了更小的 KL 值（即距离），我倾向于将其解释为“更一致”。

关于如何在这种情况下解释 scipy.stats.entropy （即 KL 散度距离）有什么见解吗？

numpy.random.normal(-2.5,0.1,1000) is a sample从正态分布。它只是按随机顺序排列的 1000 个数字。这文档 http://docs.scipy.org/doc/scipy-dev/reference/generated/scipy.stats.entropy.html for entropy says:

pk[i]是事件的（可能是非标准化的）概率i.

因此，为了获得有意义的结果，您需要“对齐”数字，以便相同的索引对应于分布中的相同位置。在你的例子中t1[0]与以下没有关系t2[0]。您的示例没有提供任何有关如何进行的直接信息probable每个值是 KL 散度所需的值；它只是为您提供一些从分布中获取的实际值。

获得对齐值的最直接方法是在某些固定值集上评估分布的概率密度函数。为此，您需要使用scipy.stats.norm（这会产生一个可以通过多种方式操作的分布对象）而不是np.random.normal（仅返回采样值）。这是一个例子：

t1 = stats.norm(-2.5, 0.1)
t2 = stats.norm(-2.5, 0.1)
t3 = stats.norm(-2.4, 0.1)
t4 = stats.norm(-2.3, 0.1)

# domain to evaluate PDF on
x = np.linspace(-5, 5, 100)

Then:

>>> stats.entropy(t1.pdf(x), t2.pdf(x))
-0.0
>>> stats.entropy(t1.pdf(x), t3.pdf(x))
0.49999995020647586
>>> stats.entropy(t1.pdf(x), t4.pdf(x))
1.999999900414918

您可以看到，随着分布进一步远离，它们的 KL 散度会增加。（事实上，使用你的第二个例子将会给出 KL 散度inf因为它们重叠得很少。）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

解释 scipy.stats.entropy 值的相关文章

在 Python 2.7 中出现“ImportError：无法导入名称 HTTPSConnection”错误

我正在尝试在 AWS ElasticBeanstalk 中部署 django 当我按照所示步骤操作时here http docs aws amazon com elasticbeanstalk latest dg create deploy
如果 Excel 文件是由程序创建的，Pandas read_excel 对于具有简单公式的单元格返回 nan [重复]

这个问题在这里已经有答案了 I use pd read excel读取由以下命令创建的 excel 文件openpyxl并从一个网址下载解析后的数据框将给出nan如果单元格值是公式 which formula is simply 100
scipy.optimize on pandas dataframe

我试图搜索它但结果很差有人可以向我解释一下如何在 Pandas DataFrame 上执行 optimize minimize 以便最小化 DataFrame 中的类别和结果列之间的错误考虑这个例子 import pandas as
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
使用 NumPy 编写一个函数来计算具有特定公差的积分

我想编写一个自定义函数来以特定容差对表达式 python 或 lambda 函数进行数字积分我知道与scipy integrate quad人们可以简单地改变epsabs但我想使用 numpy 自己编写该函数 From 这篇博文 htt
App Engine NDB：如何访问属性的 verbose_name

假设我有这个代码 class A ndb Model prop ndb StringProperty verbose name Something m A m prop a string value 当然现在如果我打印 m prop 它会
用 Python 绘制直方图

我有两个列表 x 和 y x 包含字母表 A Z Y 包含它们在文件中的频率我尝试研究如何在直方图中绘制这些值但在理解如何绘制它方面没有成功 n bins patches plt hist x 26 normed 1 facecolor
如何从hdfs读取文件[重复]

这个问题在这里已经有答案了我在 project1目录下的hadoop文件系统中有一个文本文件名mr txt 我需要编写 python 代码来读取文本文件的第一行而不将 mr txt 文件下载到本地但我无法从 hdfs 打开 mr tx
在请求中设置端口

我正在尝试利用cgminer使用 Python 的 API 我对利用requests图书馆我了解如何做基本的事情requests but cgminer想要更具体一点我想缩小 import socket import json sock
类型错误：此 COM 对象无法自动执行 makepy 过程 - 请为此对象手动运行 makepy

这是什么错误回溯错误 C Users DELL PycharmProjects MyNew venv Scripts python exe C Users DELL PycharmProjects MyNew agaaaaain py T
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
Python：在字典中查找具有唯一值的键？

我收到一个字典作为输入并且想要返回一个键列表其中字典值在该字典的范围内是唯一的我将用一个例子来澄清假设我的输入是字典 a 构造如下 a dict a cat 1 a fish 1 a dog 2 lt unique a bat 3
如何获取分类数据的分组条形图

I have a big dataset with information about students And I have to build a graph of dependencies between different value
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
无法导入QUERY_TERMS

我正在运行一个网站Python and Django Django filters 2 1 installed Django 2 1 installed 当我运行时我收到以下错误 importError Could not import
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
是否可以使用 Anaconda 包作为 Google Cloud Functions 的依赖项？

我正在使用 Python 运行时编写 Google Cloud Function 我需要包含一些无法使用的依赖项pip 如文档中所述here https cloud google com functions docs writing spe
UnicodeDecodeError：部署到 Heroku 时，“utf-8”编解码器无法解码位置 0 中的字节 0xff

我尝试在heroku上部署我的简单django项目但我不明白如何解决这个问题这是git push heroku master remote Traceback most recent call last remote File tmp
MoviePY 无法在 Windows 上检测 ImageMagick 二进制文件

我刚买了一台新笔记本电脑想要设置MoviePY在那新的Windows 64x Python3 7 0 机器我对所有内容都进行了三次检查但是当涉及到我的代码的文本部分时它向我抛出了这个错误 OSError MoviePy Error

随机推荐

如何确定地址是否在地图上的某些边界内？

我正在对此进行一些初步研究但我对这个主题知之甚少我需要创建一个解决方案可以获取一个地址然后确定该地址是否在某些预定义的边界内可能是一系列相连的街道有人对从哪里开始有一些建议吗首先您需要对地址进行地理编码 http code
加拿大人口普查地图分区 R

我对 R 和映射非常陌生我想创建某些数据的映射我有一组名为 D Montreal 的数据显示 2010 年前往蒙特利尔的加拿大人口普查部门游客来自哪个国家我想使用此数据创建一个地图以显示有多少人来自不同地区也许可以通过对根据人数
更改 Logger 实例的全局设置

我在用着java util logging Logger http download oracle com javase 1 4 2 docs api java util logging Logger html作为我的应用程序的日志引擎每
Android 布局崩溃

I use a XWalkView https crosswalk project org 加载网页和视频查看器 https github com Bilibili ijkplayer在我的应用程序中播放实时视频我希望 IjkVideoV
当存在外键但引用的行不存在时，是否可以避免NHibernate.ObjectNotFoundException？

我正在使用 NHibernate 从遗留数据库中提取一些数据并且我发现了几种存在外键的情况但引用的行已被删除当我制作 NHibernate 映射时使用 Fluent NHibernate 如下所示 References d gt d
如何使用 HTML5 和 Angularjs 正确显示日期 yyyy-MM-dd hh:mm:ss？

我正在尝试创建一个包含日期和时间的输入但我不知道如何做到这一点我尝试过输入datetime tr td Date td td td tr
ListView.SelecctedItems 显示 0 个选定项 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 好吧让我以更好的方式解释我的要求很
Java 统一编码

A Java char is 2 bytes http java sun com docs books tutorial java nutsandbolts datatypes html 最大大小为 65 536 但有95 221 http
Django 与 mod_wsgi 在 apache - 500 错误：Authtype 未设置？

尝试在 Dreamhost 上部署我的第一个 django 站点我的这个工作正常然后我不确定我做了什么让它停止工作这是错误消息 crit client 74 72 99 26 configuration error couldn t
Java中如何对整数除法进行四舍五入并得到int结果？ [复制]

这个问题在这里已经有答案了我刚刚写了一个小方法来计算手机短信的页数我没有选择使用Math ceil 老实说它看起来很丑陋这是我的代码 public class Main param args the command line arg
覆盖现有 CSS 表规则的最佳方法是什么？

我们正在使用 joomla 模板其中创建者在constant css 中定义了规则 table border collapse collapse border 0px width 100 当我需要我自己的带有自定义参数宽度边框等的表
对同一域发出 get 请求，出现 CORS 错误

在浏览器扩展中这是我的 ajax 调用 var xhr new XMLHttpRequest xhr open GET window location href true xhr responseType arraybuffer xhr
如何将整个流读入 std::string ？

我正在尝试将整个流多行读入字符串中我正在使用这段代码它有效但它冒犯了我的风格感当然有更简单的方法吗也许使用字符串流 void Obj loadFromStream std istream stream std string s
为什么Android和IOS11无法通过NFC通信

目前正在使用 React Native 并尝试使用反应本机 NFC ios https www npmjs com package react native nfc ios and 反应本机 NFC https github com Nov
使用变量名调用 Handlebars {{render}}

有没有办法将变量上下文传递给 render helper 例如我的模型具有多态关系我想为每种不同类型呈现适当的视图无需编写一整串if声明 my events模板看起来像这样 ul each event in model li even
Python docker 容器在完成运行应用程序后立即关闭，即使指定保留在 -d -t 中

我有一个 dockerfile FROM python 3 WORKDIR app ADD venv venv ADD data file1 csv gz data file1 csv gz ADD data file2 csv gz da
Serilog 滚动日志仅记录在一个文件中

有没有办法设置 Serilog 以在保持最大文件大小的同时继续登录同一文件换句话说如果我将最大文件大小指定为 100MB 则该进程应在添加新条目之前从文件中删除较早的条目 TL DR 号这File 或其RollingFile前身不
C 中经过的时间

include
消除 ffmpeg 和 image-magic 命令中的慢速因素

这些命令的基本思想是创建一个比较比较定义了过去的一张 jpeg 和现在的一张 jpeg 组合起来例如它们将相互滑动并显示前后图像 e g https media evercam io v1 cameras 1lowe scnoe com
解释 scipy.stats.entropy 值

我正在尝试使用scipy stats 熵来估计库尔巴克莱布勒 KL 两个分布之间的散度更具体地说我想使用 KL 作为衡量标准来确定两个分布的一致性但是我无法解释 KL 值例如 t1 numpy random normal 2 5

解释 scipy.stats.entropy 值

解释 scipy.stats.entropy 值 的相关文章

随机推荐

热门标签

解释 scipy.stats.entropy 值的相关文章