在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法

2024-01-03

假设：

团队永远不会改变
球队的技术没有提高
每个团队相对于其他团队的某些子集的表现的整个历史是已知的
球队之间进行的比赛数量很多，但可能很少（每支球队都没有与其他球队交手）

例如：

我有一长串比赛结果，如下所示：

Team A beats Team B
Team B beats Team A
Team A beats Team B
Team C beats Team A
Team A beats Team C

Problem:

预测任何球队击败任何其他球队的正确投注赔率。

在上面的例子中，也许我们得出结论 A 应该在 66% 的情况下击败 B。这是基于直接观察并且非常简单。然而，找到 C 击败 B 的概率似乎更困难。他们从未一起打过球，但看起来很有可能是 C > B，有些信心不足。

我所做的研究：

我读过很多关于技巧游戏的不同排名系统的内容，例如国际象棋的 Elo 和 Glicko 评级系统。这些方法的不足是因为它们对所涉及的概率分布做出了假设。例如，Elo 的中心假设是每场比赛中每个棋手的国际象棋表现是一个正态分布的随机变量。然而，根据维基百科，还有其他分布更适合现有数据。

我不想假设分布。在我看来，手头有 10,000 多个比赛结果，我应该能够从证据中推断出分布（我不知道如何做到这一点），或者使用某种不关心的强化学习方案分布是什么。

您希望对一个概率（或多个概率）做出最佳估计，并随着更多数据的可用而不断更新您的估计。这就要求贝叶斯推理 https://en.wikipedia.org/wiki/Bayesian_inference！贝叶斯推理基于以下观察：A 和 B 两种情况同时出现的概率（分布）等于 A 出现情况的概率（分布）（假设 B 出现这种情况）乘以概率B就是这种情况。以公式形式表示：

P(A,B) = P(A|B)P(B)

and also

P(A,B) = P(B|A)P(A)

因此

P(A|B)P(B) = P(B|A)P(A)

将 P(B) 带到另一边，我们得到贝叶斯更新规则:

P(A|B)' = P(B|A)P(A)/P(B)

通常，A 代表您尝试估计的任何变量（例如“x 队击败 y 队”），而 B 代表您的观察结果（例如，球队之间获胜和失败的比赛的完整历史记录）。我写了素数（即引用P(A|B)') 表示等式的左边代表您信念的更新。为了使其具体化，您的newx 队击败 y 队的概率估计，鉴于迄今为止的所有观察结果，是进行这些观察的概率鉴于您之前的估计, 乘以你的previous估计，除以看到您所看到的观察结果的总体概率（即，不假设团队之间的相对实力；一支球队大部分时间获胜的可能性低于两支球队获胜频率相同的可能性）。

当前更新左侧的 P(A|B)' 成为下一次更新右侧的新 P(A)。随着更多数据的进入，您只需不断重复此操作即可。通常，为了尽可能不偏不倚，您会从 P(A) 的完全平坦分布开始。随着时间的推移，P(A) 将变得越来越确定，尽管该算法相当能够处理您试图估计的潜在概率的突然变化（例如，如果团队 x 突然变得更强，因为有新玩家加入）团队）。

好消息是贝叶斯推理与贝塔分布 http://en.wikipedia.org/wiki/Beta_distributionElKamina 也提到过。事实上，这两者经常结合在人工智能系统中，旨在学习概率分布。虽然 Beta 分布本身仍然是一种假设，但它的优点是它可以采取多种形式（包括完全平坦和极其尖峰），因此相对而言没有理由担心您选择的分布可能会影响您的结果。

一个坏消息是，除了 beta 分布之外，您仍然需要做出假设。例如，假设您有以下变量：

A: x 队击败 y 队

B：y 队击败 z 队

C：x 队击败 z 队

并且您可以从 x 和 y 之间的直接匹配以及 y 和 z 之间的匹配中获得观察结果，但不能从 x 和 z 之间的匹配中获得观察结果。估计 P(C) 的一种简单（虽然幼稚）的方法是假设传递性：

P(C) = P(A)P(B)

无论您的方法多么复杂，您都必须定义某种概率结构来处理数据中的差距和相互依赖性。无论您选择什么结构，它始终是一个假设。

另一个坏消息是这种方法非常复杂，我无法向您详细说明如何将其应用于您的问题。鉴于您需要一个相互依赖的概率结构（给定涉及 x、y 和 z 队的其他分布，x 队击败 y 队的概率），您可能需要使用贝叶斯网络 https://en.wikipedia.org/wiki/Bayesian_network或相关分析（例如马尔可夫随机场 https://en.wikipedia.org/wiki/Markov_random_field or 路径分析 https://en.wikipedia.org/wiki/Path_analysis_(statistics)).

我希望这有帮助。无论如何，请随时要求澄清。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法的相关文章

使用主方法求解 T(n) = 2T(n/2) + n/log n 和 T(n) = 4T(n/2) + n/log n 之间的差异

我最近偶然发现了一个资源其中 2T n 2 n log ntypeMM 宣布复发无法解决我接受它作为一个引理直到今天另一种资源被证明是矛盾的在某种意义上根据资源下面的链接其中的 Q7 和 Q18 是建议分别在问题中的1和2
Codility 钉板

尝试了解 Codility NailingPlanks 的解决方案问题链接 https app codility com programmers lessons 14 binary search algorithm nailing pla
统计Sweep算子的Python实现

我正在学习一些用书中缺失的数据进行统计的技术缺失数据的统计分析作者利特尔和鲁宾对于处理单调无响应数据来说一个特别有用的函数是扫频操作员详情见第 148 151 页我知道 R 模块gmm有swp函数可以做到这一点但我想知道是否有
寻找距离原点最近的 100 颗恒星的算法

首先让我提出正确的问题问有一个文件包含超过一百万个点 x y 每个点代表一颗星星 a b 处有一颗行星地球现在任务是构建一种算法返回距离地球最近的 100 颗恒星您的算法的时间和空间复杂度是多少这个问题在各种采访中被问过很多次
如何求小于给定数的最大2次方

我需要找到小于给定数字的最大 2 次幂我陷入困境找不到任何解决方案 Code public class MathPow public int largestPowerOf2 int n int res 2 while res lt n
寻找将集合映射到整数的双射函数

对于任意两个序列 a b 其中 a a1 a2 an 且 b b1 b2 bn 0a b具有相同的元素而不关心它们的顺序例如如果 a 1 1 2 3 b 2 1 3 1 c 3 2 1 3 则 f a f b f a f b 我知道有
时间复杂度和运行时间有什么区别？

时间复杂度和运行时间有什么区别它们是一样的吗运行时间是指程序运行所需的时间时间复杂度是对输入大小趋于无穷大时运行时间渐进行为的描述您可以说运行时间是 O n 2 或其他什么因为这是描述复杂性类和大 O 表示法的惯用方式事实上
Karasuba算法递归过多

我正在尝试用 c 实现 Karasuba 乘法算法但现在我只是想让它在 python 中工作这是我的代码 def mult x y b m if max x y lt b return x y bm pow b m x0 x bm x1
将字符串中的“奇怪”字符转换为罗马字符

我需要能够将用户输入仅转换为 a z 罗马字符不区分大小写所以我感兴趣的角色只有26个然而用户可以输入他们想要的任何形式的字符西班牙语 n 法语 e 和德语 u 都可以包含用户输入中的重音符号这些重音符号会被程序删除我已
如何仅使用单个数组在 JavaScript 中模拟调用堆栈

我正在看维基百科页面 https en wikipedia org wiki Call stack在调用堆栈上并尝试理解这个图像据我所知哈哈 const memory memory 0 3 top of stack pointer m
包围一组点的多边形

我有一组 S 点 2D 由 x 和 y 定义我想找到 P 包围该组所有点的最小含义具有最少数量的点多边形 P 是S 有没有已知的算法来计算这个我在这个领域缺乏文化令人惊讶感谢您的帮助对于这个问题有很多算法它被称为最小边界框
生成所有多集大小为 n 的分区的算法

我一直在试图找出一种方法来生成多重集的所有不同的大小为 n 的分区但到目前为止却空手而归首先让我展示一下我想要实现的目标假设我们有一个输入向量uint32 t std vector
快速约会算法

我在一家咨询公司工作大部分时间都在客户所在地正因为如此我很少见到同事为了更好地了解彼此我们将安排一个晚宴会有很多小桌子方便人们聊天为了在聚会期间与尽可能多的不同的人交谈每个人都必须每隔一段时间比如每小时换一张桌子如何
直接选择排序与交换选择排序

有什么区别直接选择排序 vs 交换选择排序今天我陷入了一场争论我的教授在他的讲义中使用了这两个术语维基百科和任何教科书或网站都会为您提供的选择排序就是他所说的交换选择排序我以前从未听说过交换选择排序这个术语仅选择排序并且
GCC的sqrt()编译后如何工作？使用哪种root方法？牛顿-拉夫森？

只是对标准感到好奇sqrt 来自 GCC 上的 math h 我自己编码的sqrt 使用牛顿拉夫森来做到这一点是的我知道 fsqrt 但CPU是如何做到这一点的呢我无法调试硬件现代 CPU 中的典型 div sqrt 硬件使用 2
数学组合的完美最小哈希

首先定义两个整数N and K where N gt K 两者都在编译时已知例如 N 8 and K 3 接下来定义一组整数 0 N or 1 N 如果这使答案更简单并调用它S 例如 0 1 2 3 4 5 6 7 的子集数量S wi
计算两点之间的最短路线

过去几周我一直在开发一款多人 HTML5 游戏使用nodejs and websockets 我已经被这个问题困扰了一段时间想象一下我用数组实现了这个平铺地图如下所示 1 or 棕色瓷砖路上有障碍物玩家无法通过 0 or 绿色瓷
shell脚本中关联数组的时间复杂度

我想知道在 shell 脚本中使用关联数组时如何构造实现另外我想知道基于 shell 脚本的关联数组的时间复杂度是否是最佳的因为我们可以使用字母和数字作为它们各自的键编辑他们使用什么哈希函数如果您使用关联数组则不能通过使用
大数据使用什么数据结构

我有一个包含一百万行的 Excel 工作表每行有 100 列每行代表一个具有 100 个属性的类的实例列值是这些属性的值哪种数据结构最适合在这里使用来存储数百万个数据实例 Thanks 这实际上取决于您需要如何访问这些数据以及您想要
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h

随机推荐

java.lang.RuntimeException：运行命令获取文件权限时出错：ExitCodeException exitCode=-1073741515

问题的标题是我在 Windows 10 上安装 Hadoop 2 9 1 时遇到的异常经过几周的研究我无法找到我的标题查询的答案根据我收到的异常 hadoop 进程正在数据目录中查找权限但我已经在管理员模式下运行 dfs cmd 和
涉及前一行数据的 Python 向量化运算

我很好地掌握了如何利用 pandas 和 numpy 对整个数据列进行矢量化操作然而我遇到了一种我似乎无法矢量化的情况当计算涉及利用前一行的值来计算当前行时我必须退回到 for 循环是否可以对这种事情进行矢量化这是我的意思的一个
MySQL 更改表修改列在具有空值的行处失败

我有一个大约有 10K 行的表我正在尝试更改该表以便该字段fielddelimiter永远不会为空我正在尝试执行 alter 语句期望将任何 null 值更改为默认值但我从 sql 语句中收到错误 alter table merc
AJAX 无法在本地主机上运行

我正在尝试让 AJAX 示例正常工作但无法使其正常工作你能在 XAMPP 上正常运行吗我有三个文件 message txt index html ajaxtest js 当您单击超链接时它应该会弹出一个包含 message txt
通过 REST API 列出 Azure 虚拟机

我当前正在尝试以编程方式获取在 Windows Azure 订阅下运行的所有虚拟机的列表为此我尝试使用 Azure REST API https management core windows net https management
如何向 PHP 表单添加删除按钮以从 MySQL 表中删除行

我已将 MySQL 表的结果输出到 HTML 表在最后一列中我想添加一个删除选项该选项调用另一个表单并从 MySQL 表中删除用户但我似乎无法让它发挥作用这是我的结果页面代码 table thead thead table
如何使用 Twilio 暖转电话会议？

我已阅读有关呼叫转接的 Twilio 文档twilio文档 https www twilio com docs voice api conference resource 堆栈溢出 https stackoverflow com quest
Bootstrap 弹出框的 Angular 指令

我为引导弹出窗口编写了自定义指令但遇到了一些麻烦这是代码 angular module CommandCenterApp directive bzPopover function compile http commandHelper r
Android：ImageView 放大源图像

我似乎无法让 ImageView 以原始大小显示其源图像 ImageView 看起来像这样
Twitter Bootstrap Carousel - 访问当前索引

如何从轮播中获取当前索引在本例中我使用的是无序列表我知道我可以搜索列表项以找到具有活动 CSS 类的项但我想知道是否可以直接询问轮播对象另外能够访问目标索引在幻灯片事件上也会很方便同样我可以通过搜索来做到这一点 v
EJB weblogic.ejb20.cache.CacheFullException

我正在使用 EJB1 2 开发一个应用程序以前运行良好但从过去几天开始我遇到了以下异常 Exception in ejbLoad weblogic ejb20 cache CacheFullException size 85783 t
使用Python使用字典将罗马数字转换为整数

我正在学习编码并且我有一个练习来制作罗马数字到整数的转换器我意识到编写这个程序有很多不同的方法但如果您能帮助我找到我的错误我将不胜感激我很想听到关于如何写得更好的建议但我现在真正可以使用的是理解我在这方面做错了什么我有一本字典
如何用汇编语言（ASM）检查“数组的长度”，

我刚刚开始学习汇编语言在java中如果我们有一个数组我们总是可以使用array length来获取它的长度装配中有这样的事情吗如果是这样有人可以在这里指导我吗 Edit 我很抱歉我知道程序集没有数组我试图简化事情我的意思是
是什么原因导致“未知铬错误：-400”？

我在尝试在 WebView 中加载 URL 时收到错误是什么原因导致未知铬错误 400 我发现我忘记了
Xcode 10，命令 CodeSign 失败，退出代码非零

每次我构建控制台时都会显示此消息 CodeSign Users admin Desktop AppStoreBuild Project201 build Debug iphonesimulator Project app 在目标 Deske
“ChromeHeadless 在 60000 毫秒内没有捕获，杀死。”仅发生在 Gitlab 托管的 CI/CD 管道中

在 Gitlab 上运行 CI CD 管道时我的 Karma 测试超时并出现以下错误 wdm Compiled successfully 05 08 2019 22 25 31 483 INFO karma server Karma v4
慢速 Scala 断言

我们最近一直在分析我们的代码并且遇到了一些烦人的热点它们的形式是 assert a b a is not equal to b 因为其中一些断言可能会在代码中被调用大量次字符串连接开始累加 assert定义为 def assert a
从S3C6410板启动时无法在未知块（0,0）上挂载根文件系统

我有一块S3C6410板软件包中默认的 Linux 是 2 6 28 并且运行良好我想用更新的内核升级它我抓住了buildroot 2012 11版本然后我获取 DVD 中的默认配置文件并用它编译内核 3 6 8 引导加载程序和根文
初始化是否需要左值到右值的转换？是 `int x = x;` UB 吗？

C 标准在 3 3 2 声明点中包含一个半著名的令人惊讶的名称查找示例 int x x 这会初始化x与自身作为原始类型是未初始化的因此具有不确定的值假设它是自动变量这实际上是未定义的行为吗根据4 1 左值到右值转换对未初始
在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法

假设团队永远不会改变球队的技术没有提高每个团队相对于其他团队的某些子集的表现的整个历史是已知的球队之间进行的比赛数量很多但可能很少每支球队都没有与其他球队交手例如我有一长串比赛结果如下所示 Team A beats Tea

在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法

在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法 的相关文章

随机推荐

热门标签

在给定完整历史记录的情况下计算球队赢得体育比赛的赔率的算法的相关文章