TicTacToe AI 做出错误的决定

2024-01-01

一点背景知识：作为在 C++ 中学习多节点树的一种方法，我决定生成所有可能的 TicTacToe 棋盘并将它们存储在树中，以便从节点开始的分支都是可以从该节点开始的所有棋盘，以及节点是一步步跟随的棋盘。之后，我认为编写一个人工智能来使用该树作为决策树来玩 TicTacToe 会很有趣。

TTT 是一个可以解决的问题，完美的玩家永远不会输，所以对于我第一次尝试人工智能来说，它似乎是一个很容易编写的人工智能。

现在，当我第一次实现人工智能时，我返回并在生成时向每个节点添加了两个字段：在该节点下的所有子节点中，X 将获胜的次数和 O 将获胜的次数。我认为最好的解决方案是简单地让我的人工智能在每次移动时选择并沿着它获胜次数最多的子树走下去。然后我发现，虽然它在大多数时候都表现得很完美，但我找到了可以击败它的方法。这不是我的代码的问题，只是我让人工智能选择路径的方式有问题。

然后我决定让它选择计算机获胜最大的树或人类损失最大的树，以较大者为准。这使得它的性能更好，但仍然不完美。我仍然可以打败它。

所以我有两个想法，希望大家能提出意见，哪个更好：

1）我不是最大化胜利或失败，而是可以为胜利指定值 1，为平局指定值 0，为失败指定 -1。然后选择具有最高值的树将是最好的移动，因为下一个节点不能是导致损失的移动。这是主板一代的一个简单更改，但它保留了相同的搜索空间和内存使用情况。或者...

2) 在棋盘生成过程中，如果有一个棋盘使得 X 或 O 在下一步行动中获胜，则只会生成阻止获胜的子棋盘。不会考虑其他子节点，之后生成将正常进行。它缩小了树的大小，但是我必须实现一种算法来确定是否有一步获胜，我认为这只能在线性时间内完成（我认为这会使棋盘生成速度慢很多？）

哪个更好，或者有更好的解决方案吗？

基于决策树实现人工智能的（通常）正确方法是使用“Minimax“ 算法：

为每个叶节点分配一个分数（+1=玩家获胜，-1=玩家失败，0=平局）
沿着树向上移动，将以下规则应用于每个节点：
- 对于偶数深度（当玩家移动时），选择得分最高的子节点，并将该得分复制到节点。
- 对于奇数深度（当计算机将进行移动时），选择分数最低的子节点，并将该分数复制到节点。

当然，偶数和奇数可能需要颠倒，具体取决于您决定谁先走。

您可以在以下位置阅读更多内容：

http://ai-depot.com/articles/minimax-explained/ http://ai-depot.com/articles/minimax-explained/
http://en.wikipedia.org/wiki/Minimax http://en.wikipedia.org/wiki/Minimax

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

TicTacToe AI 做出错误的决定的相关文章

实时跟踪每分钟/小时/天的前 100 个 Twitter 单词

我最近遇到这样一个面试问题 Given a continuous twitter feed design an algorithm to return the 100 most frequent words used at this min
用于检索编辑距离接近的字符串的数据结构

例如从一组英语单词开始是否有一种结构算法允许使用单词 right 作为查询来快速检索诸如 light 和 tight 之类的字符串即我想检索与查询字符串编辑距离较小的字符串 The BK tree http blog notdot
创建横幅交换算法来轮播广告

我正在构建广告横幅轮播脚本基于印象整个月均匀地显示广告每次请求显示广告时都会进行计算所以这将是即时完成的广告应显示为一个接一个轮流播放而不是仅显示一个广告 1000 次展示然后显示另一个广告 1000 次展示大多数情况下它应该
最大流量算法的修改

我试图解决一个关于最大流量问题 http en wikipedia org wiki Maximum flow problem 我有一个源和两个接收器我需要找到该网络中的最大流量这部分是一般的最大流量然而在这个特殊版本的最大流量问题
我怎样才能找到圆的所有点？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 给定半径和圆心坐标如何找到圆的所有
Java中的马尔可夫模型决策过程

我正在用 Java 编写辅助学习算法我遇到了一个我可能可以解决的数学问题但由于处理量很大我需要一个最佳解决方案话虽这么说如果有人知道一个优化的库那就太棒了但语言是 Java 所以需要考虑到这一点这个想法相当简单对象将存储变
如何修复错误嵌套/未闭合的 HTML 标签？

我需要通过使用正确的嵌套顺序关闭任何打开的标签来清理用户提交的 HTML 我一直在寻找一种算法或Python代码来做到这一点但除了PHP等中的一些半生不熟的实现之外还没有找到任何东西例如类似的东西 p p ul li Foo bec
在 C 中打印字符串的所有排列

我正在学习回溯和递归并且我陷入了打印字符串所有排列的算法我用以下方法解决了它贝尔算法 http programminggeeks com bell algorithm for permutation 用于排列但我无法理解递归方法我在
如何在从左到右、从上到下排序的二维数组中搜索数字？

我最近收到了这个面试问题我很好奇有什么好的解决方案假设我有一个二维数组其中所有数组中的数字在增加从左到右从上到下的顺序底部搜索和搜索的最佳方式是什么判断目标号码是否在大批现在我的第一个倾向是使用二分搜索因为我的数据
如何在代码生成过程中简化包含变量的 C 风格算术表达式？

我正在尝试优化编译器中的表达式求值算术表达式都是C风格的并且它们可以包含变量我希望尽可能简化表达例如 3 100 A B 100 3 100可以简化为409 300 A B 主要取决于分配律结合律和交换律我遇到的主要困难是如何将
无痛“算法分析”培训？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我在大学时曾有过一次关于算法分析课程的痛苦经历但最近发现在大学中需要它真实世界无论如何我正在
如何最小化两个子多边形的最大纵横比？

我想使用直线将凸多边形切成给定面积比的两部分以使两个子多边形的较大纵横比最小化目前我的方法包括选择一个随机起点计算将多边形分割成目标区域的适当终点然后计算两个纵横比中较大的一个然后重复这个很多次直到我足够接近最小值多边形 A
获取无平方数的列表

获得该值的一种方法是自然数 1 n 我们对每个因子进行因式分解看看它们是否有重复的质因数但这对于大的情况来说会花费很多时间n 那么有没有更好的方法从 1 中获取无平方数n 您可以使用埃拉托斯特尼筛法的修改版本取一个布尔数组 1 n 预
如何修复：AttributeError：模块“neat”没有属性“config”

我正在浏览使用发现的 NEAT 神经网络 API 玩 flappybird 的 AI 的指南当我运行从 Github 下载的代码时出现错误 Traceback most recent call last File test py lin
以一定角度遍历二维数组

通常我们按行或列遍历数组但这里我想以角度遍历它我会尝试解释我的意思因此假设角度是 45 度那么它会搜索为 0 0 then 0 1 1 0 then 0 2 1 1 2 0 等等抱歉无法上传图像因为我是新用户不允许这样做
用于插入/删除/排名/选择查询的最佳数据结构/算法

到目前为止我知道像AVL树和红黑树这样的自平衡BST可以在O log n 次内完成这些操作然而要使用这些结构我们必须自己实现AVL树或RB树我听说有一个算法实现这四个操作而不使用自平衡 BST 有了我们自己定义的结构我们就需要
如何计算两个ip之间的主机数量？ C＃

我有两个ip 1 1 1 1 1 2 4 4 4 4 显然这只是一个例子这是一个动态计算器如果子网掩码不相关我如何计算所述 ip 之间的主机数量要计算理论 IP 地址的数量您需要将每个 IP 地址转换为其 32 位整数格式这实
如何在Scala中实现尾递归快速排序

我写了一个递归版本 def quickSort T xs List T p T T gt Boolean List T xs match case Nil gt Nil case gt val x xs head val left righ
哪种数据聚类算法适合检测时间序列事件中未知数量的聚类？

这是我的场景考虑在不同地点和时间发生的一组事件例如考虑有人在高空记录暴风雨期间城市中的雷击就我的目的而言闪电是瞬时的只能击中某些位置例如高层建筑还可以想象每次雷击都有一个唯一的 ID 以便以后可以参考该雷击这个城市大约有1
合并字符数组中的最小重复次数

假设我有两个数组我想合并它们以便合并后的数组具有最小重复次数例如 x x 是重复 arr1 x d d m f m arr2 d d x f f m 唯一的条件是在合并数组中元素来自arr1 and arr2必须出现在各自的订单中a

随机推荐

如何基于Gemfile.lock安装gems（不带Gemfile）

通常人们会使用bundle install安装宝石但它需要 Gemfile 和 Gemfile lock 可选我的情况有点不同我只有 Gemfile lock 那么我怎样才能安装所有这些基于bundle命令 I tried bund
已弃用的方法“startActivityForResult()”与正确的蓝牙设置

嘿我尝试根据官方android开发网站上的信息制作蓝牙服务但我遇到了不推荐使用的方法 startActivityForResult 我应该怎么做才能正确打开蓝牙设备这是我的代码其中包含已弃用的方法 private void enab
为什么 C++20 中不推荐使用 std::is_pod？

std is pod在 C 20 中已弃用这样选择的原因是什么我应该用什么来代替std is pod知道一个类型是否真的是一个 POD POD 正在被两个类别所取代这两个类别提供了更多细微差别这2017年11月c 标准会议 http
如何生成线程安全的统一随机数？

我的程序需要生成某个范围内的许多随机整数 int min int max 每次调用都会有一个不同的范围什么是一个好的最好是线程安全的方法来做到这一点以下不是线程安全的并且使用 rand 人们似乎不鼓励这样做 int intRand
NSToolbar：如何初始化所选项目？

我有一个 Mac OS 应用程序带有一个带有 NSToolbar 的首选项窗口我的下面还有一个自定义子视图当用户单击其中一个选项时会在第一个视图中加载其他 3 个自定义视图到目前为止一切都很好现在我意识到加载窗口时默认情况下不
TSQL - 递归 CTE 效率低下 - 需要替代方案

这是包含示例数据的表格 DECLARE TestTable TABLE ItemID INT A INT B INT Month INT INSERT INTO TestTable VALUES 1234 5 9 1 INSERT INTO
Android Studio 4.0.2 Gradle 错误：未为属性“enableGradleWorkers”指定任何值

我在用Android Studio 4 0 2我收到错误 No value has been specified for property enableGradleWorkers 发生这种情况是因为crashlytics gradle 插件
“致命错误：在第 48 行调用 /usr/bin/phpunit 中未定义的方法 PHPUnit_Util_Filter::addfiletofilter()”

我刚刚在 Ubuntu Linux 服务器上使用 PEAR 安装了 phpunit Linux mccoy 2 6 28 11 server 42 Ubuntu SMP 周五 4 月 17 日 02 45 36 UTC 2009 x86 6
Android 从图库中获取图像是旋转的

我试图让用户从图库中选择个人资料图片我的问题是有些图片向右旋转我像这样启动图像选择器 Intent photoPickerIntent new Intent photoPickerIntent setType image photoPi
填充在 Safari 和 IE 中的选择列表中不起作用

有谁知道为什么我的 Safari 不在选择列表中填充在 FF 中运行良好请告诉我该怎么做文档类型有问题吗 code
Datasnap：有没有办法检测全局连接丢失？

我正在寻找检测本地连接丢失的情况是否有办法做到这一点就像 Corelabs 组件上的事件一样 Thanks 编辑抱歉我会尝试更具体我目前正在使用 datasnap 2009 设计一个原型所以我有一个瘦客户端一个无状态服务器应用
BeautifulSoup 未提取所有 html

我们正在尝试从 Forever 21 网站的此页面获取产品网址由于某种原因 BeautifulSoup 没有获取类为 item pic 的元素即使它们位于站点 html 中我们尝试过使用 requests mechanize sele
使用加密连接字符串配置 ELMAH 和 SQL Server 日志记录

我正在尝试使用 SQL Server 2008 R2 在 ASP NET 4 应用程序中配置 ELMAH 错误日志记录有什么方法可以告诉 ELMAH 在我们提供的连接字符串上调用我们的内部解密函数吗我需要修改 ELMAH 源并重建吗
处理多个 Helm 图表之间共享的 Kubernetes 对象

我最近问了一个关于如何构建应该捆绑在一起的多个应用程序的问题并且正在考虑让每个单独的应用程序都有自己的 Helm 图表和自己的入口控制器这将允许 CI CD 轻松更新每个组件而不影响其余组件我还考虑在实际发布时使用伞图表来指定其
将数组发送到 php 中的函数

这是代码 function dosomething do something with the array like print value ar array 1 2 3 dosomething ar 这段代码工作正常我尝试做的是将数组直
TypeScript：如何为已安装的 npm 包定义自定义类型？

我喜欢用rx node http npmjs com package rx node在 TypeScript 中 import RxNode from rx node 我安装了rx node http npmjs com package r
Puppeteer 无法可视化完整的 SVG 图表

我在 Try Puppeteer 中使用此代码 const browser await puppeteer launch const page await browser newPage await page goto https www
提取 Stan 文件中转换后的数据块中的数据

我想提取z在 stanfit 对象转换后的数据块中f 是否可以 library rstan m lt stan model model code data real x transformed data real z z chi squar
在使用 psql 在本地下载/保存之前，在 AWS 实例上将表 gzip 转换为 csv

我是 PostgreSQL 和 psql CLI 的新手我的带宽极其有限这导致从 AWS 实例下载每个表每个表 1 5 GB 需要几个小时使用 psql 登录数据库后我使用的当前命令 copy SELECT FROM table
TicTacToe AI 做出错误的决定

一点背景知识作为在 C 中学习多节点树的一种方法我决定生成所有可能的 TicTacToe 棋盘并将它们存储在树中以便从节点开始的分支都是可以从该节点开始的所有棋盘以及节点是一步步跟随的棋盘之后我认为编写一个人工智能来使用该树作为

TicTacToe AI 做出错误的决定

TicTacToe AI 做出错误的决定 的相关文章

随机推荐

热门标签

TicTacToe AI 做出错误的决定的相关文章