博弈论【算法】

2023-11-03

定义

博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。如囚徒困境(链接)。

在算法竞赛中出现的博弈论题目通常是ICG(公平组合游戏)的,有如下特征:

1.有两名选手。

2.两名选手交替操作,每次一步,每步都是在有限的合法集合中选取一种进行。

3.在任何情况下,合法操作只取决于情况本身,与选手无关。

4.游戏的败北条件为:当某位选手需要进行操作时,当前没有任何可以执行的合法操作,则该选手败北。

寻找必败态即为针对此类试题给出一种解题思路。

巴什博弈

一堆n个物品,两个人轮流从中取出(1~m)个,最后取光者胜,如何判断先手赢还是后手赢。

显然,如果n=m+1,那么由于一次最多只能取m个,所以无论先取者拿走多少个,后取者都能够一次拿走剩余的物品,后取者胜。所以当一方面对的局势是n%(m+1)=0时,其面临的是必败的局势 。由此我们可以得到取胜的法则:如果n=(m+1)*r+s,(r 为任意自然数,s≤m),那么先取者要拿走s 个物品,如果后取者拿走k(k≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)*(r-1)个,以后保持这样的取法,那么先取者肯定获胜。总之,要保证给对手留下(m+1)的倍数,就能最后获胜。

例题1:

一天,TT在寝室闲着无聊,和同寝的人玩起了取石子游戏,而由于条件有限,他们是用旺仔小馒头当作石子。游戏的规则是这样的。设有一堆石子,数量为N(1<=N<=1000000),两个人轮番取出其中的若干个,每次最多取M个(1<=M<=1000000),最先把石子取完者胜利。我们知道,TT和他的室友都十分的聪明,那么如果是TT先取,他会取得游戏的胜利么?

输入

第一行是一个正整数n表示有n组测试数据

输入有不到1000组数据,每组数据一行,有两个数N和M,之间用空格分隔。

输出

对于每组数据,输出一行。如果先取的TT可以赢得游戏,则输出“Win”,否则输出“Lose”(引号不用输出)

题解:

#include <stdio.h>
#include <stdlib.h>
int main()
{
    int m, n, group;
    scanf("%d", &group);

    while (group--)
    {
        scanf("%d%d", &n, &m);
        if (n % (m + 1) == 0)
            printf("Lose\n");
        else
            printf("Win\n");
    }
    system("pause");
    return 0;
}

例题2:

Lele听说街上正在举行一场别开生面的拍卖会,拍卖的物品正好就是一块20亩的田地。于是,Lele带上他的全部积蓄,冲往拍卖会。后来发现,整个拍卖会只有Lele和他的死对头Yueyue。通过打听,Lele知道这场拍卖的规则是这样的:刚开始底价为0,两个人轮流开始加价,不过每次加价的幅度要在1~N之间,当价格大于或等于田地的成本价 M 时,主办方就把这块田地卖给这次叫价的人。Lele和Yueyue虽然考试不行,但是对拍卖却十分精通,而且他们两个人都十分想得到这块田地。所以他们每次都是选对自己最有利的方式进行加价。由于Lele字典序比Yueyue靠前,所以每次都是由Lele先开始加价,请问,第一次加价的时候,Lele要出多少才能保证自己买得到这块地呢?

输入:

本题目包含多组测试,请处理到文件结束(EOF)。每组测试占一行。每组测试包含两个整数M和N(含义见题目描述,0<N,M<1100)

输出:

对于每组数据,在一行里按递增的顺序输出Lele第一次可以加的价。两个数据之间用空格隔开。如果Lele在第一次无论如何出价都无法买到这块土地,就输出"none"。

Sample Input
4 2
3 2
3 5
Sample Output
1
none
3 4 5

题解:

只要加价让剩余价格是(n+1)的倍数,就可以到达必败点。

如果m是(n+1)的倍数,Lele输
如果m大于等于n,Lele赢
如果m不是(n+1)的倍数,那么加价m%(1+n)),lele就可以赢

#include <stdio.h>
#include <stdlib.h>
int main()
{
    int m, n;
    while (scanf("%d%d", &m, &n) != EOF)
    {
        if (m % (n + 1) == 0)
        {
            printf("none\n");
        }
        else
        {
            if (n >= m)
            {
                for (int i = m; i <= n; ++i)
                {
                    printf(i == m ? "%d" : " %d", i);
                }
                printf("\n");
            }
            else
            {
                printf("%d\n", m % (n + 1));
            }
        }
    }
    system("pause");
    return 0;
}

减法博弈

巴什博弈有一种变形,叫做减法博弈。用s表示一个正整数构成的集合,基于S所定义的减法游戏可以描述如下:

有一个由n个石子组成的石子堆,两名玩家轮流从中拿走石子,每次拿走石子的个数只能是集合S中的数。拿走最后一枚石子的玩家获胜。
例:S = {1, 3, 4},如果在游戏的开始有100枚石子,判断先手的输赢

题解:

可以通过由小到大找规律,找出N和P来确定100是必败态还是必胜态。

X 0 1 2 3 4 5 6 7 8 9 10 11 12
状态 P N P N N N N P N P N N N

通过观察发现,该游戏中的P位置(必败态)是那些能被7整除或者模7余2的位置,其他位置都是N位置(必胜态)。

//减法博弈
int main()
{
    int m;
    while (scanf("%d", &m) != EOF)
    {
        if (m % 7 == 0 || m % 7 == 2)
            printf("Lose\n");
        else
            printf("Win\n");
    }
    system("pause");
    return 0;
}

威佐夫博弈

有两堆各若干个物品,两个人轮流从某一堆或同时从两堆中取同样多的物品,规定每次至少取一个,多者不限,最后取光者得胜。

解决思路:A:设(ai,bi)(ai ≤bi ,i=0,1,2,…,n)表示两堆物品的数量并称其为局势,如果甲面对(0,0),那么甲已经输了,这种局势我们称为奇异局势。

分析:

  • 第0个(0 , 0),先手输,当游戏某一方面对( 0 , 0)时,他没有办法取了,那么肯定是在上一局取完了,那么先手输。

  • 第1个 ( 1 , 2 ),先手输,先手只有四种取法,
    1)取 1 中的一个,那么后手取第二堆中两个。
    2)取 2 中一个,那么后手在两堆中各取一个。
    3)在 2 中取两个,那么后手在第一堆中取一个。
    4)两堆中各取一个,那么后手在第二堆中取一个。
    可以看出,不论先手怎么取,后手总是能赢。所以先手必输!

  • 第2个 ( 3 , 5 ),先手必输。首先先手必定不能把任意一堆取完,如果取完了很明显后手取完另一堆先手必输,那么假如看取一堆的情况,假设先手先在第一堆中取。 取 1 个,后手第二堆中取4个,变成(1 ,2)了,上面分析了是先手的必输局。取 2 个,后手第二堆中取3个,也变成( 1 , 2)局面了。

    假设先手在第二堆中取,取 1 个,那么后手在两堆中各取 2 个,也变成 ( 1 , 2 )局面了。取 2 个 ,那么后手可以两堆中都去三个, 变成 ( 0 , 0)局面,上面分析其必输。取 3 个,后手两堆各取 1 个 ,变成( 1 , 2)局面了。取 4 个,后手在第一堆中取一个,变成( 1 , 2)局面了。可见不论先手怎么取,其必输!

  • 第3个(4 , 7),先手必输。

  • 自己推理可以发现不论第一次先手如何取,那么后手总是会变成前面分析过的先手的必输局面。
    那么到底有什么规律呢,我们继续往下写。
    第4个 ( 6 ,10 )
    第5个 ( 8 ,13)
    第6个 ( 9 , 15)
    第7个 ( 11 ,18)
    会发现他们的差值是递增的,为 0 , 1 , 2, 3, 4 , 5 , 6, 7…n
    而用数学方法分析发现局面中第一个值为前面局面中没有出现过的第一个值,比如第三个局面,前面出现了 0 1 2,那么第三个局面的第一个值为 3 ,比如第五个局面,前面出现了 0 1 2 3 4 5 ,那么第五个局面第一个值为6。再找规律的话我们会发现,第一个值 = 差值 * 1.618 再取整,而1.618 = (sqrt(5)+ 1)/ 2 。

    大家都知道0.618是黄金分割率。而威佐夫博弈正好是1.618,这就是博弈的奇妙之处!

那么任给一个局势(a,b),怎样判断它是不是奇异局势呢?

我们总结了如下公式:ak =[k(1+√5)/2],bk= ak + k (k=0,1,2,…,n 方括号表示取整函数)

威佐夫博弈常见的问题:

  1. 给你一个局面,让你求先手的输赢。
    有了上面的分析,那么这个问题应该不难解决。首先求出差值,差值 * 1.618 == 最小值 的话后手赢,否则先手赢。(注意这里的1.618最好是用上面式子计算出来的,否则精度要求高的题目会错)

  2. 给你一个局面,让你求先手的输赢,假设先手赢的话输出他第一次的取法。

    首先讨论在两边同时取的情况,很明显两边同时取的话,不论怎样取他的差值是不会变的,那么我们可以根据差值计算出其中的小的值,然后加上差值就是大的一个值,当然能取的条件是求出的最小的值不能大于其中小的一堆的石子数目。

    假如在一堆中取的话,可以取任意一堆,那么其差值也是不定的,但是我们可以枚举差值,差值范围是0 — 大的石子数目,然后根据上面的理论判断满足条件的话就是一种合理的取法。

例题:

有两堆石子,数量任意,可以不同。游戏开始由两个人轮流取石子。游戏规定,每次有两种不同的取法,一是可以在任意的一堆中取走任意多的石子;二是可以在两堆中同时取走相同数量的石子。最后把石子全部取完者为胜者。现在给出初始的两堆石子的数目,如果轮到你先取,假设双方都采取最好的策略,问最后你是胜者还是败者。

Sample Input

2 1

8 4

4 7

Sample output:(如果最后你是胜者,则为1,反之,则为0)

0

1

0

题解

注意要保证前一个数字比第二个数字小

#include <stdio.h>
#include <math.h>
int main(){
	int a,b,temp;
	double q;
	while(scanf("%d %d",&a,&b)){
		if(a>b){
			//交换位置
			temp = a;
			a = b;
			b = temp; 
		}
		
			q = (1+sqrt(5))/2; 
			if(int((b-a)*q)== a)
				printf("0\n");
				else
					printf("1\n");
	}
	return 0;
} 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

博弈论【算法】 的相关文章

  • WKWebView 使用和坑

    iOS8以后 苹果推出了新框架Wekkit 提供了替换UIWebView的组件WKWebView 各种UIWebView的问题没有了 速度更快了 占用内存少了 一句话 WKWebView是App内部加载网页的最佳选择 先看下 WKWebVi

随机推荐

  • docker 安装 mongodb

    1 拉取最新的镜像 docker pull mongo latest 2 运行容器 docker run itd name mongo p 27017 27017 mongo auth 参数说明 p 27017 27017 映射容器服务的
  • 堆排序(C)

    文章目录 堆排序 堆的定义 堆排序 构造大根堆 构造小根堆 实现堆排序 测试代码 算法复杂度 堆排序 堆排序的基本思想 对于一组待排序数据 首先按堆的定义建立初始堆 大根堆或小根堆 取出堆顶元素 最大或最小 将剩余的元素继续调整成新堆 就得
  • FeignClient带文件多对象传参

    生产者 ApiOperation value 切块上传 notes 切块上传 PostMapping uploadChunk public Result uploadChunk HttpServletRequest request Chun
  • C语言计算平均分

    已知某位学生的数学 英语和计算机课程的成绩分别是87分 72分和93分 求该生3门课程的平均成绩 结果按整型输出 输入格式 本题无输入 输出格式 按照下列格式输出结果 math 87 eng 72 comp 93 average 计算所得的
  • windows 重启进程和重启服务脚本

    重启进程 以重启远程粘贴板服务为例 已验证 taskkill F IM rdpclip exe 表示杀死进程 F强制杀死 IM 指定杀死的进程名 start rdpclip exe 启动进程 重启服务 未验证 net stop 服务名 ne
  • 自制JLink-ob-072

    陆陆续续的在网上查了两天资料 发现了三篇很有用的文章 一篇是关于固件的 一篇关于硬件的设计 一篇是教你怎么用usb接口给stm32刷固件 有了这三篇资料 自制一个Jlink ob 应该是没问题的了 下面放上链接 固件篇 http www o
  • 剑指offer——day3

    题目1 替换空格 char replaceSpace char s int i 0 int j 0 int len strlen s int cnt 0 for i 0 i lt len i if s i cnt char ans char
  • Ajax与Axios的区别

    目录 1 Ajax与Axios的区别 2 mvvm模式下更适合这种数据 3 ajax书写形式 4 axios书写形式 5 vue 中使用的 axios 代码 总结 1 Ajax与Axios的区别 Axios axios 是通过promise
  • 【技巧】Markdown 交叉引用

    注意 csdn 不支持 md 的跳转 可以使用 toc 生成目录 1 Markdown 引用同一个文件的某一标题 title title 使用 选中章节 将大写字母改成小写 去掉括号 等特殊字符 空格用 替代 2 Markdown 引用另一
  • spring框架历史漏洞复现

    目录 一 docker 1 启动docker 2 列出容器 3 关闭容器 4 进入docker 二 CVE 2016 4977 原理 1 登陆 2 访问url 3 构造payload 4 测试 5 反弹shell 6 编码后的命令结合poc
  • An ASIC Low Power Primer by J. bhaskar

    原文链接 https www academia edu 33242660 An ASIC Low Power Primer by J bhaskar Vlsi Design Power Electronics VLSI VLSI and C
  • jacoco简单教程

    问题 2023 06 06 10 45 52 974563 jacoco简单教程 答案 Jacoco是一个Java代码覆盖率工具 可以帮助开发人员了解他们的代码被测试的程度 以下是Jacoco的简单教程 添加Jacoco插件 在项目的bui
  • golang类型转换与类型断言

    类型转换在程序设计中都是不可避免的问题 当然有一些语言将这个过程给模糊了 大多数时候开发者并不需要去关注这方面的问题 但是golang中的类型匹配是很严格的 不同的类型之间通常需要手动转换 编译器不会代你去做这个事 我之所以说通常需要手动转
  • AD设置某个焊盘铺铜连接方式

    AD设置某个焊盘铺铜连接方式 在规则中创建个别焊盘铺铜连接方式 目的 PCB布板时 将表贴焊盘与铺铜连接方式设置为花焊盘 十字连接 将螺钉孔与铺铜连接方式设置为全连接 步骤一 所有焊盘与铜皮默认为十字连接 单独设置螺钉孔与铜皮全连接 步骤二
  • MYSQL相关问题解惑

    MYSQL如何查看默认存储引擎 方式1 使用show engines语句查看系统中所有的存储引擎 Support列的值表示某种引擎是否能使用 YES表示可以使用 NO表示不能使用 DEFAULT表示该引擎为当前默认存储引擎 方式2 也可以使
  • Linux基本操作指令

    Linnux课程框架学习 LINUX 初识阶段 常用操作 常用工具 1 Linux 系统编程阶段 1 gt 进程概念 2 gt 进程控制 3 gt 基础IO 4 gt 进程间通信 5 gt 进程信号 6 gt 多线程 2 LINUX 网络编
  • 魔兽怀旧服联盟服务器不稳定,魔兽世界怀旧服转服服务关闭最后一天,联盟部落新的对抗...

    魔兽世界这款经典了十几年的游戏有好多的话题可聊 不过恒古不变的热门话题中 联盟与部落的对抗永不过时 在经典怀旧服暂停转服服务即将到来的前一天 某知名论坛又出现了单边大服中阵营之争的唇枪舌战 具体是什么原因引起的 暂时还没有本服大佬出面解释
  • 最全的雅思8000词汇pdf_雅思剑桥1-14同义词汇总,屠鸭必备!(含剑14)

    剑14真题出来之后很多烤鸭私聊哥说什么时候有剑14的同义词替换啊 这不 哥这就来分享了 一个合格的雅思考生的词汇量要在7000左右 而在雅思考试中关于词汇的运用最重要的一部分是 同义词替换 同义词的考察贯穿了雅思考试听说读写的每一项 Lis
  • 【unity笔记】OnCollision和OnTrigger方法使用的一个误区【2D】

    最近在做2D游戏 所以经常使用到两个检测碰撞的方法 OnCollisionXX 方法或OnTriggerXX方法 两个方法的使用大致相同 传入的参数略有差别 void OnCollisionEnter2D Collision2D colli
  • 博弈论【算法】

    目录 定义 巴什博弈 减法博弈 威佐夫博弈 定义 博弈论主要研究公式化了的激励结构间的相互作用 是研究具有斗争或竞争性质现象的数学理论和方法 博弈论考虑游戏中的个体的预测行为和实际行为 并研究它们的优化策略 如囚徒困境 链接 在算法竞赛中出