实现 alpha-beta 剪枝算法时函数中的奇怪行为

2023-12-05

我已经实现了带有 alpha-beta 修剪的极小极大算法。为了获得最佳动作，我将 alpha-beta 算法称为rootAlphaBeta功能。然而，在rootAlphaBeta函数时，我发现了一些非常奇怪的行为。当我打电话给rootAlphaBeta函数与ply共 4 个，它拨打了大约 20 000 个电话，但是当我拨打alphaBeta直接调用函数，只调用了大约2000次。我似乎找不到问题所在，因为调用次数应该是相同的。

两种算法最终找到的走法应该是一样的吧？我想是的，至少这一步棋的分数是一样的，我无法知道这一步棋的结果alphaBeta选择当我直接调用它而无需rootAlphaBeta.

def alphaBeta(self, board, rules, alpha, beta, ply, player):
    """Implements a minimax algorithm with alpha-beta pruning."""
    if ply == 0:
        return self.positionEvaluation(board, rules, player)

    move_list = board.generateMoves(rules, player)
    for move in move_list:
        board.makeMove(move, player)
        current_eval = -self.alphaBeta(board, rules, -beta, -alpha, ply - 1,
                                       board.getOtherPlayer(player))
        board.unmakeMove(move, player)

        if current_eval >= beta:
            return beta

        if current_eval > alpha:
            alpha = current_eval

    return alpha


def rootAlphaBeta(self, board, rules, ply, player):
    """Makes a call to the alphaBeta function. Returns the optimal move for a 
    player at given ply."""
    best_move = None
    max_eval = float('-infinity')

    move_list = board.generateMoves(rules, player)
    for move in move_list:
        board.makeMove(move, player)
        current_eval = -self.alphaBeta(board, rules, float('-infinity'),
                                       float('infinity'), ply - 1,
                                       board.getOtherPlayer(player))
        board.unmakeMove(move, player)

        if current_eval > max_eval:
            max_eval = current_eval
            best_move = move

    return best_move

Your rootAlphaBeta不更新alpha价值。当它可以缩小除第一个之外的所有子节点的范围时，它会使用 (-inf, inf) 的完整范围来调用其所有子节点。这将防止修剪一些对最终得分没有影响的分支，并增加节点数。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

实现 alpha-beta 剪枝算法时函数中的奇怪行为的相关文章

如何在 PyCharm 中“查看”/突出显示制表符和空格以检查缩进？

这可能听起来很愚蠢但我还是个新手有没有明确的方法可以发现 PyCharm 中的制表符或空格位于错误的位置或者甚至以可视方式显示所有制表符和空格我只是花了很长时间在函数的 Def 行寻找无效语法错误的问题我原以为这可能仍然是一些
在 while 循环中更改 tkinter 画布中的图像

我的完整代码是here https gist github com ItsBerry de245ba70376cb07f4dbe2d25c223f5f 我正在尝试使用 tkinter 的画布创建一个小游戏让人们练习学习高音谱号上的音符最
使用 matplotlib 在图像数据之上对线网格进行像素精确定位

我试图在 python 库 matplotlib 显示的图像网格顶部精确地覆盖 1 像素宽线的网格不幸的是我似乎无法对结果进行足够精细的控制以实现线网格与数据网格的正确对齐如下面的代码所示结果似乎总是很接近但并不完全正确我尝试
如何在Python中获得更精确的十进制值[重复]

这个问题在这里已经有答案了 from math import sqrt a 1e 8 b 10 c 1e 8 x1 b sqrt b 2 4 a c 2 a x2 b sqrt b 2 4 a c 2 a print x1 format x
在Python中用空格分割字符串——保留带引号的子字符串

我有一个像这样的字符串 this is a test 我正在尝试用 Python 编写一些内容以将其按空格分开同时忽略引号内的空格我正在寻找的结果是 this is a test 附言我知道您会问如果引号内有引号会发生什么嗯在
swig char ** 作为指向 char * 的指针

我在使用 swig 和 char 作为指向变量 char 的指针时遇到问题而不是作为 char 的列表我找不到将指针包装到 char 的方法目的是将连接的结果写入指针引用的 char 中以下是我的代码文件指针 cpp includ
检查字符串是否以 XXXX 开头

我想知道如何在Python中检查字符串是否以 hello 开头在 Bash 中我通常这样做 if string hello then do something here fi 我如何在Python中实现同样的效果 aString hell
如果新文件不存在则写入新文件，如果存在则追加到文件

我有一个程序可以写入用户的highscore到一个文本文件该文件由用户选择时命名playername 如果具有该特定用户名的文件已经存在那么程序应该附加到该文件以便您可以看到多个highscore 如果具有该用户名的文件不存在例如
Plotly - 不同颜色的表面

我正在尝试在 Plotly for Python 中绘制多个曲面每个曲面具有不同的颜色具体来说表面显示了在相空间中不同点采取行动的预测奖励函数由于我在每个点都有多个可能的操作因此每个点都是不同的表面我想对每个表面进行独特的着色
在python中浏览ftp目录

我正在尝试使用 ftplib 使用 Python 3 从 ftp 服务器下载多个文件夹我有一个文件夹名称列表它们都位于文件夹 root 中问题是我不知道如何浏览它们当我使用cwd我可以进入更深的目录但是如何再次起来呢我正在尝试得
如何在 Google App Engine 中为模型定义唯一属性？

我需要一些独特的属性我怎样才能实现这个目标有没有类似的东西unique True 我正在使用适用于 Python 的 Google App Engine Google 提供了执行此操作的函数 http code google com a
类型错误：无法连接“str”和“instance”对象（python urllib）

写一个python程序我在使用时遇到了这个错误urllib urlopen功能 Traceback most recent call last File ChurchScraper py line 58 in
如何读取 sql 查询到 pandas dataframe / python / django

我在下面使用这个views py获取应用程序 from django db import connection def test request cursor connection cursor sql SELECT x n from ta
如何在Python模拟中调用模拟方法

我想创建一个模拟方法来调用被模拟的底层方法我正在想象类似以下的内容但我找不到任何有关模拟对象的文档该对象包含对被模拟对象的引用我将其表示为 wrapped method foo below from mock import patc
中断QThread睡眠

我想知道如何暂停 QThread 然后在收到信号时恢复我已阅读并知道我可以做这样的事情 def run self self ready False while not self ready self sleep 1 QtCore Slot
如何使用 Python Flask-Security 使用 bcrypt 加密密码？

我正在尝试使用 Flask Security 文档中的标准基本示例并使其正常工作除了密码以明文形式存储之外我知道这一行 user datastore create user email email protected cdn cgi
Django：上传前调整图像大小

我想调整图像大小 Pillow 在上传之前我在下面编写了代码但不起作用并得到错误 myapp list 处的属性错误坚定的请求方式 POST 请求网址 http 127 0 0 1 8000 myapp list http 127
将glade接口放入python中

我在 Glade 中制作了一个 gui 我想将其放入 python 程序中我正在调整我在网上找到的教程中的说明以将其加载到我的林间空地文件中 http www pygtk org articles pygtk glade gui Cre
使用 PyCharm 分析 Django

即使在开发环境中我的应用程序也相当慢所以我想找出是什么导致它变慢以便我可以尝试修复它我了解调试工具栏根据它的报告数据库查询和下载的源都不是问题所以它一定是业务逻辑但是我无法使用 Django 服务器运行 PyCharm 分
vtkPythonAlgorithm 控制管道执行

我正在尝试用 python 编写一个 vtk 过滤器ProjectDepthImage进行投影不是问题它控制 vtk 管道的执行基本上我对 UserEvent 有一个回调当用户在渲染窗口处于活动状态时按下 u 键时会触发该回调这将

随机推荐

有条件地更改目标框架版本

我正在尝试将 ifdef d 代码库编译到两个不同的目标框架即 3 5 和 4 0 我尝试修改解决方案中的 proj 文件但无济于事看来 MSBuild VS2012 没有通过 UI 获取解决方案配置更改这是 proj 文件之一的片段
Vaadin 8：每 1 分钟从服务器重新加载一次网格数据

我正在尝试为网格提供自动刷新功能基本上每 n 秒用来自服务器的最新数据更新网格每当用户启用自动刷新时我就能够实现 PollListner UI ui TestUI getCurrent Boolean value isRefresh
Swift 3.0 中的 UICollectionViewController 错误：必须使用非零布局参数进行初始化

我是 iOS 开发新手我一直在学习 Swift 今天我尝试使用 UICollectionViewController 我的代码如下 class ViewController UICollectionViewController UICo
为什么 ci" 和 ci(, ci{.... 表现不同？

我们都知道什么ci ci ci ci 做在日常编辑中非常方便我发现了一些奇怪的地方查了帮助没有找出原因说我有一个文件 foo target foo target foo target foo target foo target
在 GitHub 存储库上显示 Jenkins 构建的当前状态

有没有办法在我的项目的 GitHub Readme md 上显示 Jenkins 构建状态我使用 Jenkins 来运行持续集成构建每次提交后它都会确保所有内容都已编译并执行单元和集成测试然后最终生成文档和发布包仍然存在无意中犯
如何在方法上的所有装饰器的基础上应用类装饰器

我正在使用这种方式装饰所有方法 import inspect def decallmethods decorator prefix test def dectheclass cls for name m in inspect getmemb
Android Fragment手柄后退按钮按下[重复]

这个问题在这里已经有答案了我的活动中有一些片段 1 2 3 4 5 6 按下后退按钮后如果当前活动片段是 2 我必须从 2 返回到 1 否则不执行任何操作这样做的最佳实践是什么 EDIT 应用程序不得从 3 6 返回到 2 当您在 F
如何在 save search netsuite 中采用基于数量的定价

我必须创建一个保存搜索并获取基于数量的商品定价怎么做为了获取单价我使用以下公式 DECODE inventorylocation WH29 locationquantityavailable 添加示例 var itemIds for
WPF DataGrid 中的冻结行？

有没有人有一些代码可以在启用虚拟化的情况下冻结 WPF DataGrid 顶部的行我们看到一些代码没有关闭虚拟化但我们需要在虚拟化打开的情况下使用它一些仅适用于非虚拟化 DataGrid 的链接冻结 DataGrid 行使用 wp
配置 Access 报表以使用 SQL Server 存储过程作为其记录源

我正在尝试在 MS Access 2010 中使用 MS SQL Server 存储过程的结果创建报告在我的 VBA 代码中我尝试 Dim qdf As DAO QueryDef Set qdf CurrentDb CreateQuery
JSP/Servlet 应用程序中的 main() 方法在哪里？ [复制]

这个问题在这里已经有答案了我问这个问题的原因是我想编写代码在应用程序启动后对其进行初始化并稍后进行清理我不想使用 servletinit 方法因为它是针对每个 servlet 的没有main Servlet 中的方法 If 我问这
如何在docker中安装.net框架？

我想将 dotnet Framework 4 6 1 安装到 microsoft dotnet latest 映像中 net core 需要此映像但我还需要该框架首先建议更新您的标签使用情况以引用 MCR 位置请参阅https gi
JHipster Generator v4.14 未显示 React 选项

使用 JHipster 创建应用程序时它没有显示React问题选项您希望客户端使用哪种框架在 v4 14 x 中 React 支持仍处于实验阶段因此您需要运行jhipster experimental启用 React 支持但最近
连接字符串缺少必需的属性：使用新的 CosmosClient(CosmosConnectionString) 时出现 AccountEndpoint 错误

我正进入状态The connection string is missing a required property AccountEndpoint使用时出错new CosmosClient CosmosConnectionString
如何在 Html.actionLink 的参数中传递 IEnumerable Model

我有个问题我需要保存模型的所有值在index cshtml中我有 model IEnumerable 在我看来我可以在 foreach 中获取所有值 foreach 模型中的var项项目 ID 项目名称 But 我需要将整个模型传
如何从 std::map 过滤项目？ [复制]

这个问题在这里已经有答案了我大致有以下代码这可以变得更好或更高效吗也许使用std remove if 您可以在遍历地图时从地图上删除项目吗我们可以避免使用临时地图吗 typedef std map
使用Python用HTML表单“发布”数据填写“可填写的pdf”？

我正在尝试构建一个小型 Flask Web 应用程序该应用程序显示从 HTML 表单构建的工作申请表其中包含许多字段供申请人填写我想从此 HTML 表单中获取输入的数据并使用该数据填写我用 Adob e Acrobat DC Pro
如何以编程方式强制停止 UIScrollView 中的滚动？

注此处给出的答案对我不起作用我有一个 UIScrollView 不是表视图只是一个自定义的东西当用户执行某些操作时我想终止视图内的任何滚动拖动或减速我试过做例如这 scrollView scrollRectToVisible
合成视频和音频 - 视频的音频消失了

我的问题是我正在使用下面的功能来编写视频和音频我想保留视频的原始声音但它不知何故消失了我没有任何线索我从这里得到这个功能这个答案我尝试在附加后立即更改卷AVMutableCompositionTrack但没用例如 mutabl
实现 alpha-beta 剪枝算法时函数中的奇怪行为

我已经实现了带有 alpha beta 修剪的极小极大算法为了获得最佳动作我将 alpha beta 算法称为rootAlphaBeta功能然而在rootAlphaBeta函数时我发现了一些非常奇怪的行为当我打电话给rootAl

实现 alpha-beta 剪枝算法时函数中的奇怪行为

实现 alpha-beta 剪枝算法时函数中的奇怪行为 的相关文章

随机推荐

热门标签

实现 alpha-beta 剪枝算法时函数中的奇怪行为的相关文章