增量熵计算

2024-02-28

Let std::vector<int> counts是一个正整数向量，让N:=counts[0]+...+counts[counts.length()-1]是向量分量的总和。环境pi:=counts[i]/N，我使用经典公式计算熵H=p0*log2(p0)+...+pn*log2(pn).

The counts向量正在变化 --- 计数增加 --- 每 200 次变化我都会重新计算熵。经过快速谷歌和 stackoverflow 搜索后，我找不到任何增量熵计算的方法。那么问题来了：有没有一种增量方法，就像方差一样 http://en.wikipedia.org/wiki/Algorithms_for_calculating_variance#Online_algorithm，用于熵计算？

编辑：这个问题的动机是使用此类公式进行增量信息增益估计VFDT http://homes.cs.washington.edu/~pedrod/papers/kdd00.pdf-像学习者一样。

解决： See 这个数学溢出帖子 https://mathoverflow.net/questions/133977/incremental-entropy-computation/134376#134376.

我导出了熵和基尼指数的更新公式和算法并做了笔记可以在 arXiv 上找到 http://arxiv.org/abs/1403.6348。（注释的工作版本可用here http://blazsovdat.com/publications/incremental.pdf.) 另请参阅这个数学溢出 https://mathoverflow.net/questions/133977/incremental-entropy-computation/134376#134376 answer.

为了方便起见，我添加了简单的 Python 代码，演示了导出的公式：

from math import log
from random import randint
      
# maps x to -x*log2(x) for x>0, and to 0 otherwise 
h = lambda p: -p*log(p, 2) if p > 0 else 0

# update entropy if new example x comes in 
def update(H, S, x):
  new_S = S+x
  return 1.0*H*S/new_S+h(1.0*x/new_S)+h(1.0*S/new_S)

# entropy of union of two samples with entropies H1 and H2
def update(H1, S1, H2, S2):
  S = S1+S2
  return 1.0*H1*S1/S+h(1.0*S1/S)+1.0*H2*S2/S+h(1.0*S2/S)

# compute entropy(L) using only `update' function 
def test(L):
  S = 0.0 # sum of the sample elements
  H = 0.0 # sample entropy 
  for x in L:
    H = update(H, S, x)
    S = S+x
  return H

# compute entropy using the classic equation 
def entropy(L):
  n = 1.0*sum(L)
  return sum([h(x/n) for x in L])

# entry point 
if __name__ == "__main__":
  L = [randint(1,100) for k in range(100)]
  M = [randint(100,1000) for k in range(100)]
  
  L_ent = entropy(L)
  L_sum = sum(L)
  
  M_ent = entropy(M)
  M_sum = sum(M)
  
  T = L+M
  
  print("Full = ", entropy(T))
  print("Update = ", update(L_ent, L_sum, M_ent, M_sum))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

增量熵计算的相关文章

为什么模板类的静态成员不唯一

看一下下面的代码 include
如何从对Web服务发出的请求中获取客户端IP地址

我的 IIS 中托管有一个 Web 服务当客户端直接使用我的服务时我需要找出客户端 IP 地址 like http MyIpAddress MyApplication MyWebServiceClass asmx http MyIpAd
ptrace和waitpid有什么关系？

我正在练习使用ptrace但我不太了解它和之间的关系waitpid 这是我的测试程序 int main int argc char argv pid t pid 22092 if ptrace PTRACE ATTACH pid NULL
为基于架构的 XML 文件创建 WPF 编辑器

这是场景我们的服务器产品之一使用大型 XML 配置文件该文件的布局相当好并且针对 XSD 文件进行了验证现在是时候构建一个配置 GUI 来维护这个文件了我想深入研究 WPF 来完成它我可以为每个配置部分布置一个单独的表单每次向
这种对有效类型规则的使用是否严格遵守？

C99和C11中的有效类型规则规定没有声明类型的存储可以用任何类型写入并且存储非字符类型的值将相应地设置存储的有效类型抛开 INT MAX 可能小于 123456789 的事实不谈以下代码对有效类型规则的使用是否严格符合 inclu
为什么下面的重叠比较总是评估为 true

我不明白为什么以下代码有警告指出重叠比较始终评估为真接下来的语句永远不会被执行 QVariant MainModel data const QModelIndex index int role const if index isVali
C# 中不区分大小写的替换不使用正则表达式？

有没有一种方法可以在不使用 C 中的正则表达式的情况下对字符串进行不区分大小写的替换像这样的东西 string x Hello x x Replace hello hello world 你可以尝试类似的东西 string str Hel
Moq - 是否可以在不使用 It.IsAny 的情况下设置模拟

我一直使用 Moq 进行单元测试有时我会嘲笑有很多参数的方法想象一下这样的方法 public class WorkClient public void DoSomething string itemName int itemCount
我如何模拟 UserManager 和 RoleManager 进行单元测试

我模拟了抽象类来测试类的具体方法如下所示 var mock new Mock
是否可以在对Where 的调用中调用命名方法？

我试图从 RedGate 的这本免费电子书中了解 Linq 的一些性能影响ftp support red gate com ebooks under the hood of net memory management part1 pdf f
C++ 更改屏幕方向问题 -- DEVMODE dmDisplayOrientation DMDO_90 undefined

我似乎无法编译一些 C 代码我正在翻转显示器的方向但 VS2008 告诉我 DMDO 90 和 DMDO 270 无法识别 error C2065 DMDO 90 undeclared identifier error C2065 DM
C# SignalR 异常 - 连接在收到调用结果之前开始重新连接

我正在开发 2 个应用程序第一个是 C 控制台应用程序另一个是 Asp net Web 应用程序我正在使用 SignalR 连接两者这是我的 C 控制台应用程序客户端 public class RoboHub public sta
在 boost 元组、zip_iterator 等上使用 std::get 和 std::tie

我有哪些使用选择std get lt gt and std tie lt gt 与增强结构一起例子我想使用基于范围的 for 循环在多个容器上进行迭代我可以实施zip函数它使用boost zip iterator include
什么是 C++11 扩展 [-Wc++11-extensions]

我需要一些帮助来了解此错误发生的位置警告非静态数据成员的类内初始化是 C 11 扩展 Wc 11 extensions 这是它来自的代码部分 typedef struct Hand bool straight false bool fl
C# XML 反序列化。将节点中的所有内部文本读取到字符串属性中

我目前正在尝试修改我的类以便我的模型上的文本属性包含某个节点的所有内部文本 text node 给我带来问题的 xml 示例是
为什么在 C++ 类中的数据成员上使用像 m_ 这样的前缀？

许多 C 代码使用语法约定来标记数据成员常见的例子包括 m memberName对于公共成员在所有使用公共成员的情况下 memberName对于私人会员或所有会员其他人尝试强制使用this gt member每当使用数据成员时根据我
OpenCV 仅围绕大轮廓绘制矩形？

第一次发帖希望我以正确的方式放置代码我正在尝试检测和计算视频中的车辆因此如果您查看下面的代码我会在阈值处理和膨胀后找到图像的轮廓然后我使用 drawContours 和矩形在检测到的轮廓周围绘制一个框我试图在 drawCont
如何编写完全可移植的 4 字节字符常量的编译时初始化

遗留代码大致如下所示 define MAKEID a b c d UInt32 a lt lt 24 UInt32 b lt lt 16 UInt32 c lt lt 8 UInt32 d define ID FORM MAKEID F
从最大到最小的3个整数

我是 C 初学者我使用编程使用 C 的原理与实践第二版问题如下编写一个程序提示用户输入三个整数值然后以逗号分隔的数字顺序输出这些值如果两个值相同则应将它们排列在一起 include
C#“var”关键字在 VB.NET 中的等价物是什么？

例如我如何获得 VB NET静态类型局部变量是static赋值右侧的表达式的类型像这样 Dim http msdn microsoft com en us library 7ee5a7s1 aspx我的变量 3 你还需要选项推断 ht

随机推荐

如何在 git 上恢复旧提交中的特定文件

我想我的问题很接近这个one https stackoverflow com questions 20971306 hg how do i revert a single file several commits back 但我正在使用 g
使用 SQL Developer 或 Toad 等 IDE 工具的 Oracle 并行查询行为

一段时间以来我一直在努力抽出时间来写这个问题并尽可能地解释这个问题所以请提前原谅我的长文我的环境 Oracle Database 12 2 在 Red Hat 7 R A C 2 个节点上运行每个节点 16CPU 和 64GB R
在一个 SELECT 语句中设置两个标量变量？

我想做这个 Declare a int Declare b int SET a b SELECT StartNum EndNum FROM Users Where UserId 1223 PRINT a PRINT b 但这是无效的语法如
如何在 Gatsby URL 中添加发布日期？

All the Gatsby 入门演示 https github com gatsbyjs gatsby gatsby starters有一条像这样的路径 gatsby starter blog hi folks 我该如何设置 2015 0
Cron 作业 + Twitter

从 12 30 开始一直到 1 30 2 30 等我的应用程序每小时都会发布一条静态推文我目前正在使用 themattharris 的 twitter API 我也有一个 cron 工作 30 php q home1 USER NAM
PyQt5 和 datetime.datetime.strptime 之间的冲突

所以我正在编写一个工具可以使用基于 python 3 52 和 Qt5 的图形用户界面从文件中读取时间最少的操作 datetime datetime strptime Tue a 在隔离环境中工作输出 1900 01 01 00 00
在 php 5.5 中使用什么来代替 apc 用户数据缓存？

PHP 5 5 默认包含 zend opcache 这基本上意味着几乎没有人会使用 APC 但是用什么来代替 APC 的用户数据缓存部分 apc store apc fetch 类似呢我真正喜欢使用 APC 用户数据缓存的一个用例是静态
如何在vba中另存为.txt

我希望让我的宏将我创建的新工作表保存为 txt 文件这是我到目前为止的代码 Sub Move Move Macro Keyboard Shortcut Ctrl m Sheets Sheet1 Select Range A1 Select
绘制完成后清除CGPath路径

我已经在 iOS 中编写了一个在 TouchMoved 方法中绘图的程序 CGContextAddPath UIGraphicsGetCurrentContext path CGPathMoveToPoint path NULL lastP
OpenCV - Java：inRange 函数

我有我的形象mRgba当我这样做时 Core inRange mRgba B1 B2 mRgba 我得到了我期望的结果我的所有 RGBA 图像的阈值都在 B1 和 B2 之间现在我想这样做 Mat roi mRgba submat re
Pytorch：获取最终层的正确尺寸

Pytorch 新手来了我正在尝试微调 VGG16 模型来预测 3 个不同的类别我的部分工作涉及将 FC 层转换为 CONV 层但是我的预测值不会落在 0 到 2 3 个类别之间有人可以向我指出有关如何计算最后一层的正确尺寸的好
pyder 中的 Python 调试器在第 2 行停止

当我尝试调试代码时调试器在第 2 行停止并且不响应任何命令例如转到下一行我正在使用 python 3 9 7 This is what the console looks like If I try to stop the debug
无法加载共享库“libgdiplus” - Docker [带有 Aspose API 的 .NET 应用程序]

当我创建用于部署的 docker 文件时应用程序通常在开发环境中工作但它失败了libgdiplus issue Docker文件 FROM mcr microsoft com dotnet core aspnet 3 0 AS base
具有并排输入字段的 HTML 表单

我有一个基本上是垂直的 html 表单但我真的不知道如何在同一行上创建两个文本字段例如下面的表格我希望名字和姓氏在同一行而不是一个在另一个下面
将 UIButton 锚定到 UITableViewController 视图的底部

我有以下要求当一个UITableViewController显示的视图中行数是可变的在行下方应显示一个按钮当行数较小时按钮应固定在视图的底部当行数较多时删除按钮应紧接在最后一行之后放置换句话说 And not 到目前为止
CSS，位置：绝对，滚动条

假设有一个页面 div div LEFT div div RIGHT div div 为什么水平滚动条只考虑右溢出换句话说为什么 LEFT 不触发滚动条而 RIGHT 却触发呢除了body gt overflow hidden 对于
获得平均系数和 adj。使用 lapply 来自多个合并回归的 R^2

我使用循环函数执行了多个池回归并将回归输出存储在列表中 myregression 我现在想做的是对我的所有回归即 myregression 列表有效地执行 lmtest 包中的 coeftest 函数以调整标准误差和 t 统计量最
Python 中的梯形波

如何用Python生成梯形波我研究了 SciPy 和 NumPy 等模块但没有成功是否有像 scipy signal gaussian 这样的模块返回代表高斯函数波的值数组我使用梯形内核生成了这个Astropy https en w
加载图像时 WPF 抛出“无法定位资源”异常

我有一个 WPF 窗口其中包含本地系统中一个文件的背景图像所以 XAML 文件看起来像这样
增量熵计算

Let std vector

增量熵计算

增量熵计算 的相关文章

随机推荐

热门标签

增量熵计算的相关文章