混合策略纳什均衡——附例题及解析

2023-11-05

目录

引入

混合纳什均衡

例题

求法


引入

假设这样一种对局,甲乙两人抽扑克牌,扑克牌只有两种花色,红和黑,两张牌花色相同算甲胜,反之乙胜,那么甲乙双方应该如何设定自己抽出不同花色的概率呢?

比如,设甲抽红牌的概率P=60%,那么黑牌概率就是1-P=40%,这样显然不合理

因为B会发现甲出红牌的概率明显大于黑牌,干脆B全出黑牌,这样就有60%的情况是B胜,A显然赢不了

根据生活经验我们很容易推测出P应该取50%,这样B全出一种牌最终获胜的概率也是50%,这样对B来说没有任何优势,很符合A的选择。


混合纳什均衡

(P,Q)是一个组合,并不是前面引入的四个格子里的某一个格子,而是这四个格子里面怎么样用百分数组合起来

所以混合策略求解最终的结果就是(P,Q)这样的一个组合,这个组合什么意思呢,画到图中大概下图这个样子


例题

比如上题,显然这就是一个扔硬币判定输赢的游戏(两个硬币同正或同反就判A赢,反之判B赢,显然最优混合策略为0.5,0.5)

假设我们不知道他们的策略,下面来求解

设A的策略为P,即他扔的硬币正面的概率为P,反面就是(1-P),在这种条件下我们来判断B的效用


求法

B为正面:

-1*P+1*(1-P)

B为反面:

1*P+(-1)*(1-P)

我们要让B在A的两种选择下所获得的效用相等(如果不相等就说明B的两个选择中其中一个明显在概率上优于另一个,如果这样的话B只需要一直选择优势的一种就可以打败A

注意,我们要求的其实是A的选择的概率P,所以站在A的角度显然不能让B发现自己的两种选择里有一种更优的选择,而是让这两种选择的效用在概率上都一样,因此,我们让这两个式子相等

-1*P+1*(1-P)= 1*P+(-1)*(1-P)

求出P=0.5

这样我们就求出了P,下面来求Q

设B选择正面的概率为Q,反面就是(1-Q),那么A在此条件下不同选择的效用就为

A为正面:1*Q+(-1)*(1-Q)

A为反面:(-1)*Q+1*(1-Q)

同理使两者相等得出Q=0.5

所以混合战略纳什均衡为{P,Q}={0.5概率选正面,0.5概率选正面}


注意:这里P,Q都为0.5,如果遇到题目数值不等,要区分P,Q分别指的是哪一方的哪种选择,默认P属于A方,Q属于B方,所以要区分PQ是这两方的哪种选择,在这道题里P是A选正面的概率,Q是B选正面的概率,其余同理

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

混合策略纳什均衡——附例题及解析 的相关文章

随机推荐

  • Android手机定位恶意代码,基于动态特征的Android恶意代码检测和定位方法

    Android Malicious Code Detection and Localization based on Runtime Feature Wang Songhe 1 王淞鹤 1994年 男 硕士 主要研究方向为安卓安全 Guo
  • ChromeDriver淘宝镜像地址

    https npm taobao org mirrors chromedriver
  • java队列中的offer、poll方法

    首先 这个方法所在的包是java util Queue 1 offer boolean offer E e 将指定的元素插入此队列 如果立即可行且不会违反容量限制 当使用有容量限制的队列时 此方法通常要优于 add E 后者可能无法插入元素
  • MySQL收费方式

    导读 网络上多数朋友担心甲骨文会对MySQL软件采用收费模式 多数朋友也不清楚MySQL开源到底是什么模式 开源 免费嘛 是很多的疑问 MySQL是遵守双重协议的 一个是GPL授权协议 一个是商用授权协议 注释 为解决其他企业用MySQL软
  • Python的必学技术——Jupyter Notebook

    推荐 Jupyter NoteBook 的原因 整合所有的资源 交互性编程体验和零成本重现结果 Jupyter NoteBook 能够把软件代码 计算输出 解释文档 多媒体资源整合在一起的多功能科学运算平台 很符合英文里说一图胜千言 A p
  • pytorch-yolov3 train 报错

    UserWarning indexing with dtype torch uint8 is now deprecated please use a dtype torch bool insteadhttps github com erik
  • NB-IoT、Cat.1、5G将迎来新一波发展浪潮

    据工信部5月7日消息 工信部办公厅发布关于深入推进移动物联网全面发展的通知 通知提出主要目标和重要任务 通知全文如下 各省 自治区 直辖市及新疆生产建设兵团工业和信息化主管部门 各省 自治区 直辖市通信管理局 相关企业 移动物联网 基于蜂窝
  • Charles 弱网测试

    知识了解 网络延时 网络延时指一个数据包从用户的计算机发送到网站服务器 然后再立即从网站服务器返回用户计算机的来回时间 通常使用网络管理工具PING Packet Internet Grope 来测量网络延时 由于互联网络的复杂性 网络流量
  • 浏览器输入url后回车后全过程及其优化

    浏览器输入URL后回车后 会发生什么 嗯嗯 很经典的问题 概括性大致流程是这样的 1 查询URL对应的IP地址 DNS域名解析 2 建立TCP连接 连接服务器 3 浏览器发起请求 4 服务器响应浏览器请求 5 浏览器解析响应 渲染页面 6
  • 代码随想录算法训练营第二十四天

    LeetCode 77 组合 链接 77 组合 思路 回溯算法的典型应用 回溯算是理解难度比较大的算法了 经常会有一些循环嵌套在递归里 其本质就是罗列出所有的组合排列 可能性 因为是暴力算法时间复杂度都比较高 有时候需要搭配一定的剪枝操作
  • 数据结构——二叉树的遍历

    树 是一种重要的数据结构 本文浅谈二叉树的遍历问题 采用C语言描述 一 二叉树基础 1 定义 有且仅有一个根结点 除根节点外 每个结点只有一个父结点 最多含有两个子节点 子节点有左右之分 2 存储结构 二叉树的存储结构可以采用顺序存储 也可
  • GitHub Actions + Nginx 部署React App到云服务器

    初始化环境 一台云服务器 我的服务器是基于centos的华为云 个人电脑安装好git node环境 安装Nginx 进入云服务器控制台 远程连接进服务器终端 或者本地终端输入ssh 你的服务器用户名 你的服务器公网ip 如果出现Someon
  • Doxygen文档系统---入门

    Doxygen简介 Doxygen是一种开源跨平台的 以类似JavaDoc风格描述的文档系统 完全支持C C Java Objective C和IDL语言 部分支持PHP C 注释的语法与Qt Doc KDoc和JavaDoc兼容 Doxy
  • 神兵利器

    声明 该公众号大部分文章来自作者日常学习笔记 也有部分文章是经过作者授权和其他公众号白名单转载 未经授权 严禁转载 如需转载 联系开白 请勿利用文章内的相关技术从事非法测试 如因此产生的一切不良后果与文章作者和本公众号无关 现在只对常读和星
  • WebRTC建立会话流程分析

    WebRTC建立会话流程总结 了解如何运行PeerConnection Demo后 熟悉运行流程可以做为深入学习WebRTC的切入点 本节重点解释客户端双方建立会话时交互的主要信令 控制会话的文本协议 和与信令相关的 WebRTC API
  • node-sass报错

    我们安装vue项目时 经常遇到nade sass报错 然后切换到某个node版本后不再报错 原因见下文 一 报错内容 二 保存原因 本地nodejs版本跟安装的node sass版本不一致 三 解决办法 1 查看本地node版本 node
  • 使用书签修改视频播放速度(javascript:)

    增加书签 网址输入以下内容 javascript document querySelector video playbackRate 2 0 2 0是2倍速 根据需要自行修改速度 使用方法 打开视频后 点一下书签即可修改视频速度 如果没有改
  • 如何提高训练模型准确率

    8个经过证实的方法 提高机器学习模型的准确率 摘要 本文分享了 8 个经过证实的方法 这些方法用来改善模型的预测表现 它们广为人知 但不一定要按照文中的顺序逐个使用 导语 提升一个模型的表现有时很困难 如果你们曾经纠结于相似的问题 那我相信
  • Android开发指南!2021中级Android开发面试解答,完整版开放下载

    Google 为了帮助 Android 开发者更快更好地开发 App 推出了一系列组件 这些组件被打包成了一个整体 称作 Android Jetpack 它包含的组件如下图所示 老的 support 包被整合进了 Jetpack 例如上图
  • 混合策略纳什均衡——附例题及解析

    目录 引入 混合纳什均衡 例题 求法 引入 假设这样一种对局 甲乙两人抽扑克牌 扑克牌只有两种花色 红和黑 两张牌花色相同算甲胜 反之乙胜 那么甲乙双方应该如何设定自己抽出不同花色的概率呢 比如 设甲抽红牌的概率P 60 那么黑牌概率就是1