使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动

2024-04-24

我正在为游戏开发 AI，我想使用MinMax算法与Alpha-Beta 修剪.

我对它的工作原理有一个粗略的了解，但我仍然无法从头开始编写代码，所以我花了两天的时间在网上寻找某种伪代码。

我的问题是，我在网上找到的每个伪代码似乎都是基于寻找最佳动作的值，而我需要返回最佳动作本身而不是数字。

我当前的代码基于这个伪代码（source https://www3.ntu.edu.sg/home/ehchua/programming/java/JavaGame_TicTacToe_AI.html)

minimax(level, player, alpha, beta){  // player may be "computer" or "opponent"
    if (gameover || level == 0)
       return score
    children = all valid moves for this "player"
    if (player is computer, i.e., max's turn){
       // Find max and store in alpha
       for each child {
          score = minimax(level - 1, opponent, alpha, beta)
          if (score > alpha) alpha = score
          if (alpha >= beta) break;  // beta cut-off
       }
       return alpha
    } else (player is opponent, i.e., min's turn)
       // Find min and store in beta
       for each child {
          score = minimax(level - 1, computer, alpha, beta)
          if (score < beta) beta = score
          if (alpha >= beta) break;  // alpha cut-off
       }
       return beta
    }
}

// Initial call with alpha=-inf and beta=inf
minimax(2, computer, -inf, +inf)

正如您所看到的，此代码返回一个数字，我猜想这是使一切正常工作所必需的（因为返回的数字在递归期间使用）。

所以我想我可以使用外部变量来存储最佳移动，这就是我更改之前代码的方式：

minimax(level, player, alpha, beta){  // player may be "computer" or "opponent"
    if (gameover || level == 0)
       return score
    children = all valid moves for this "player"
    if (player is computer, i.e., max's turn){
       // Find max and store in alpha
       for each child {
          score = minimax(level - 1, opponent, alpha, beta)
          if (score > alpha) {
              alpha = score
              bestMove = current child // ROW THAT I ADDED TO UPDATE THE BEST MOVE
          }
          if (alpha >= beta) break;  // beta cut-off
       }
       return alpha
    } else (player is opponent, i.e., min's turn)
       // Find min and store in beta
       for each child {
          score = minimax(level - 1, computer, alpha, beta)
          if (score < beta) beta = score
          if (alpha >= beta) break;  // alpha cut-off
       }
       return beta
    }
}

// Initial call with alpha=-inf and beta=inf
minimax(2, computer, -inf, +inf)

现在，这对我来说是有意义的，因为只有轮到玩家并且该动作比前一个更好时，我们才需要更新最佳动作。

所以，虽然我认为这是正确的（即使我不是 100% 确定），source https://www3.ntu.edu.sg/home/ehchua/programming/java/JavaGame_TicTacToe_AI.html还有一个java更新的实现bestMove即使在score < beta案例，我不明白为什么。

尝试使用该实现导致我的代码选择对方玩家的移动作为最佳移动，这似乎不正确（假设我是黑人玩家，我正在寻找我可以做出的最佳移动，所以我期待的是“黑”棋，而不是“白”棋）。

我不知道我的伪代码（第二个）是否是使用以下命令找到最佳动作的正确方法MinMax with α-β剪枝或者如果我需要更新最好的动作，即使是在分数 case.

如果您愿意，请随意建议任何新的和更好的伪代码，我不受任何约束，并且如果比我的更好，我不介意重写一些代码。

EDIT:

由于我无法理解这些回复，我想也许这个问题没有问我想知道的问题，所以我试图在这里写得更好。

假设我只想为一名球员获得最佳走法，并且该球员，这是最大化者，被传递给MinMax每当我需要新的动作时都会起作用（这样minmax(2, black, a, b)返回黑色玩家的最佳走法，同时minmax(2, white, a ,b)返回白人玩家最好的一个），您将如何更改第一个伪代码（或java源中的实现）将给定的最佳移动存储在某处？

EDIT 2:

让我们看看是否可以让它以这种方式工作。

这是我的实现，你能告诉我它是否正确吗？

//PlayerType is an enum with just White and Black values, opponent() returns the opposite player type
protected int minMax(int alpha, int beta, int maxDepth, PlayerType player) {        
    if (!canContinue()) {
        return 0;
    }
    ArrayList<Move> moves = sortMoves(generateLegalMoves(player));
    Iterator<Move> movesIterator = moves.iterator();
    int value = 0;
    boolean isMaximizer = (player.equals(playerType)); // playerType is the player used by the AI        
    if (maxDepth == 0 || board.isGameOver()) {
        value = evaluateBoard();
        return value;
    }
    while (movesIterator.hasNext()) {
        Move currentMove = movesIterator.next();
        board.applyMove(currentMove);
        value = minMax(alpha, beta, maxDepth - 1, player.opponent());
        board.undoLastMove();
        if (isMaximizer) {
            if (value > alpha) {
                selectedMove = currentMove;
                alpha = value;
            }
        } else {
            if (value < beta) {
                beta = value;
            }
        }
        if (alpha >= beta) {
            break;
        }
    }
    return (isMaximizer) ? alpha : beta;
}

EDIT 3:

基于@Codor 的回答/评论的新实现

private class MoveValue {
    public Move move;
    public int value;

    public MoveValue() {
        move = null;
        value = 0;
    }

    public MoveValue(Move move, int value) {
        this.move = move;
        this.value = value;
    }

    @Override
    public String toString() {
        return "MoveValue{" + "move=" + move + ", value=" + value + '}';
    }

}

protected MoveValue minMax(int alpha, int beta, int maxDepth, PlayerType player) {
    if (!canContinue()) {
        return new MoveValue();
    }
    ArrayList<Move> moves = sortMoves(generateLegalMoves(player));
    Iterator<Move> movesIterator = moves.iterator();
    MoveValue moveValue = new MoveValue();
    boolean isMaximizer = (player.equals(playerType));
    if (maxDepth == 0 || board.isGameOver()) {            
        moveValue.value = evaluateBoard();
        return moveValue;
    }
    while (movesIterator.hasNext()) {
        Move currentMove = movesIterator.next();
        board.applyMove(currentMove);
        moveValue = minMax(alpha, beta, maxDepth - 1, player.opponent());
        board.undoLastMove();
        if (isMaximizer) {
            if (moveValue.value > alpha) {
                selectedMove = currentMove;
                alpha = moveValue.value;
            }
        } else {
            if (moveValue.value < beta) {
                beta = moveValue.value;
                selectedMove = currentMove;
            }
        }
        if (alpha >= beta) {
            break;
        }
    }
    return (isMaximizer) ? new MoveValue(selectedMove, alpha) : new MoveValue(selectedMove, beta);
}

我不知道我是否做对了或者做错了什么，但我又回到了我发布问题时遇到的问题：

calling minMax(Integer.MIN_VALUE, Integer.MAX_VALUE, 1, PlayerType.Black)返回一个只能由白人玩家完成的动作，这不是我需要的。

我需要给定玩家的最佳走法，而不是整个棋盘的最佳走法。

经过一些研究并浪费了大量时间来解决这个问题，我想出了这个似乎有效的解决方案。

private class MoveValue {

    public double returnValue;
    public Move returnMove;

    public MoveValue() {
        returnValue = 0;
    }

    public MoveValue(double returnValue) {
        this.returnValue = returnValue;
    }

    public MoveValue(double returnValue, Move returnMove) {
        this.returnValue = returnValue;
        this.returnMove = returnMove;
    }

}


protected MoveValue minMax(double alpha, double beta, int maxDepth, MarbleType player) {       
    if (!canContinue()) {
        return new MoveValue();
    }        
    ArrayList<Move> moves = sortMoves(generateLegalMoves(player));
    Iterator<Move> movesIterator = moves.iterator();
    double value = 0;
    boolean isMaximizer = (player.equals(playerType)); 
    if (maxDepth == 0 || board.isGameOver()) {            
        value = evaluateBoard();            
        return new MoveValue(value);
    }
    MoveValue returnMove;
    MoveValue bestMove = null;
    if (isMaximizer) {           
        while (movesIterator.hasNext()) {
            Move currentMove = movesIterator.next();
            board.applyMove(currentMove);
            returnMove = minMax(alpha, beta, maxDepth - 1, player.opponent());
            board.undoLastMove();
            if ((bestMove == null) || (bestMove.returnValue < returnMove.returnValue)) {
                bestMove = returnMove;
                bestMove.returnMove = currentMove;
            }
            if (returnMove.returnValue > alpha) {
                alpha = returnMove.returnValue;
                bestMove = returnMove;
            }
            if (beta <= alpha) {
                bestMove.returnValue = beta;
                bestMove.returnMove = null;
                return bestMove; // pruning
            }
        }
        return bestMove;
    } else {
        while (movesIterator.hasNext()) {
            Move currentMove = movesIterator.next();
            board.applyMove(currentMove);
            returnMove = minMax(alpha, beta, maxDepth - 1, player.opponent());
            board.undoLastMove();
            if ((bestMove == null) || (bestMove.returnValue > returnMove.returnValue)) {
                bestMove = returnMove;
                bestMove.returnMove = currentMove;
            }
            if (returnMove.returnValue < beta) {
                beta = returnMove.returnValue;
                bestMove = returnMove;
            }
            if (beta <= alpha) {
                bestMove.returnValue = alpha;
                bestMove.returnMove = null;
                return bestMove; // pruning
            }
        }
        return bestMove;
    }   
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动的相关文章

如何自定义BlockingQueue的阻塞行为

我想创建一个阻塞队列它根据自定义规则而不是队列中的项目数量来阻止生产者例如生产者生成一些文件并放入队列中消费者经过一番分析后将它们转移到特定位置对于上述场景如果队列中的总文件大小达到某个阈值我希望生产者等待生成新文件如果总大
Firebase 查询 Or'ing whereEqualTo 以获得可能值的列表

我见过之前针对早期版本的 Firebase 提出过这个问题 https stackoverflow com questions 26700924 query based on multiple where clauses in fireba
JavaEE 8 教程，在 hello1 项目上部署失败

我正在尝试学习 Java EE 8 我遵循了官方指南https javaee github io tutorial https javaee github io tutorial 但我有这个问题 cargo maven2 plugin 1
以编程方式将 PEM 证书导入 Java KeyStore

我有一个由两个文件 crt 和 key 组成的客户端证书我希望将其导入到 java KeyStore 中然后在 SSLContext 中使用以通过 Apache 的 HTTPClient 发送 HTTP 请求但是我似乎找不到一种以
方法不必要地被调用？

我有一个 BaseActivity 它可以通过其他所有活动进行扩展问题是每当用户离开暂停活动时我都会将音乐静音我也不再接听电话问题是 onPause每当用户在活动之间切换时就会被调用这意味着应用程序不必要地静音和停止tele
Java：检查给定日期是否在当前月份内

我需要检查给定的日期是否在当前月份我编写了以下代码但 IDE 提醒我getMonth https docs oracle com javase 7 docs api java util Date html getMonth and ge
如何在具有动态列的表中插入值 Jdbc/Mysql

我想在具有动态列的表中添加值我设法创建一个包含动态列的表但我不知道如何插入数据 Create Table sql CREATE TABLE MyDB myTable level INTEGER 255 int columnNumber
我们可以在三元运算符（Java）中使用命令吗？

这是一个工作代码 String a first String b second String object System out println object null a b 但它不是 String a first String b se
如何模拟一个方面

我目前正在使用aspectj 开发一些监控工具因为这个工具应该是技术独立的尽可能所以我没有使用 Spring 进行注入但我希望我的方面能够经过单元测试方面示例 Aspect public class ClassLoadAspect
如何使用 Java 原生接口从 Java 调用 Go 函数？

可以通过以下方式调用 C 方法JNA https en wikipedia org wiki Java Native AccessJava 中的接口如何使用 Go 实现相同的功能 package main import fmt impor
java 属性文件作为枚举

是否可以将属性文件转换为枚举我有一个包含很多设置的属性文件例如 equipment height equipment widht equipment depth and many more like this and not all a
通用 JSF 实体转换器[重复]

这个问题在这里已经有答案了我正在编写我的第一个 Java EE 6 Web 应用程序作为学习练习我没有使用框架只是使用 JPA 2 0 EJB 3 1 和 JSF 2 0 我有一个自定义转换器用于将存储在 SelectOne 组件中
嵌入式 tomcat 7 servlet 3.0 注释不起作用

我有一个精简的测试项目其中包含 Servlet 版本 3 0 用注释声明如下所示 WebServlet test public class TestServlet extends HttpServlet private static f
存储过程将多个表返回到 spring jdbc 模板

我正在使用 JdbcTemplate 从 Spring DAO 类调用存储过程我的问题是存储过程返回多个表有没有办法使用 Spring JdbcTemplate 访问多个表如果我使用jdbcTemplate queryForList
Scala repl 抛出错误

当我打字时scala在终端上启动 repl 它会抛出此错误 scala gt init error error while loading AnnotatedElement class file usr lib jvm java 8 ora
防止 Firebase 中的待处理写入事务不起作用

我的目标是在单击按钮时将名称插入 Cloud Firestore 中但如果用户未连接到互联网我不希望保存处于挂起状态我不喜欢 Firebase 保存待处理写入的行为即使互联网连接已恢复我研究发现Firebase 开发人员建议使用事
Java SE + Spring Data + Hibernate

我正在尝试使用 Spring Data Hibernate 启动 Java SE 应用程序并且到目前为止已经完成了以下操作配置文件 Configuration PropertySource classpath hibernate pro
JDK 7 的快速调试/调试构建

我正在寻找 JDK 的调试或者我猜他们称之为快速调试构建以启用在运行时生成的打印程序集以及查找性能问题时所需的其他诊断就目前情况而言我似乎找不到可以直接使用的现成的快速调试构建二进制包有人可以帮我提供下载链接或者至少提供有关
日期时间解析异常

解析日期时我的代码中不断出现异常错误日期看起来像这样 Wed May 21 00 00 00 EDT 2008 这是尝试读取它的代码 DateTimeFormatter formatter DateTimeFormatter ofPat
使用 Android 的 Mobile Vision API 扫描二维码

我跟着这个tutorial http code tutsplus com tutorials reading qr codes using the mobile vision api cms 24680关于如何构建可以扫描二维码的 Andr

随机推荐

在 Ruby 中模拟 int64 溢出

我是一名资深程序员但对 Ruby 还很陌生我正在尝试移植一种名为 CheckRevision 的算法用于在登录 Battle net 的在线游戏服务之前检查游戏文件的完整性该算法使用给定的公式对文件进行哈希没有无聊的细节而是不
从 apache Spark 读取/写入 dynamo 数据库 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我想知道是否有任何 Java 库支持从 apache Spark Mesos 读取写入 dynamo
获取同一 FK 日期差异的前一条记录

我需要在一小时内插入同一客户的前 1 条记录如果记录在一小时后插入则不需要该记录请参见下表这只是数千条记录的样本我正在使用 SQL Server 2005 替代文本 http img651 imageshack us img651
如何在node.js中关闭数据库连接？

当我关闭数据库连接时node js我收到这个错误 Cannot enqueue Query after invoking quit 这是我的code socket on adminConnect function email connect
Java 大型数据库插入

我有一个数据库需要在其中插入批量数据一次大约 500k 条记录我正在使用 derby 进行测试发现这么多记录的插入时间约为 10 15 分钟我正在用 Java 进行批量插入这次看起来是否很慢在普通笔记本电脑上工作有没有办法加
在 SQL Server 的 select 语句中使用带有 TOP 的变量，而不使其动态化 [重复]

这个问题在这里已经有答案了 declare top int set top 5 select top top from tablename 是否可以或者对这样的逻辑有什么想法我不想使用动态查询是的在 SQL Server 2005
避免 Firebase 可调用函数的 CORS 预检

我有一个Firebase 可调用云函数 https firebase google com docs functions callable我在浏览器中的 javascript 应用程序中调用它由于请求主机是 cloudfunctions
Spring自动装配参数化集合

大家好感谢您提前的帮助我遇到一个问题 Spring 无法自动装配 ArrayBlockingQueue 类型的参数化成员变量这是java代码 Controller public class SomeController Autowir
WPF 使用凭据启动浏览器

我正在使用 WPF 和 C 我希望能够启动一个浏览器窗口最有可能是 IE 并提供已知的凭据以便基于 Windows 的应用程序可以处理从自身到外部浏览器的转换而无需用户再次输入他她的凭据我确实知道如何启动浏览器 System Di
仅在模块中加载 Yii Bootstrap

我尝试仅在管理模块中加载 Yii Bootstrap 扩展但它不起作用我假设我需要预加载它或以某种方式启动它谢谢 class AdminModule extends CWebModule public function init im
UIWebView 不断尝试加载但没有结果

我正在尝试使用 UIWebView 连接到 wikiTravel 页面这是我的代码 NSURL url NSURL URLWithString http wikitravel org en Beijing NSURLRequest req
从命令行运行 Jupyter Notebook (.ipynb)，就像它是 .py 文件一样

我正在本地计算机上编写 Jupyter 笔记本该笔记本最终将在远程服务器运行 Ubuntu 上运行每次我需要进行更改时我都必须将笔记本导出为 py文件然后从服务器的命令行调用它我希望能够即时运行它调用一个命令来获取当前的 ip
Gmail 的操作邮件程序配置

我正在尝试将使用 Gmail SMTP 的电子邮件传送添加到我的应用程序中我之前已经完成了不太安全的应用程序方式但我不想在这个项目中使用此选项我试图查看谷歌的文档或一些宝石以使其工作但无济于事每个人都只是发送一些代码如下所示
使背景图像与屏幕大小相同

我希望背景图像填满屏幕并且不担心失去宽高比已经证实了一切不要认为我错过了任何明显的事情 HTML phone margin auto height 737px width 654px background image url imgs
比较sql server中两个字符串中的数字

我有两个字符串作为 CountryLocationIDs 和 LocationIDs 其值 CountryLocationIDs 400 600 150 850 160 250 LocationIDs1 600 150 900 然后我需要另
如何为特定用户选择最后一行？

我有一个这样的表 requests id id user unix time 1 2353 1339412843 2 2353 1339412864 3 5462 1339412894 4 3422 1339412899 5 3422 13
我的 Rails 路由应该是什么样子才能与 pushState Ember.js 路由一起使用？

简而言之当构建 Ember js 应用程序以持久保存到 Rails 应用程序时我应该如何处理 Rails 路由视图我想我只需要 Rails 来渲染 application html erb 布局以便 Ember js 应用程序初始
如何修复 Chrome 扩展程序“未捕获的引用错误：文档未定义”错误？ [复制]

这个问题在这里已经有答案了我正在创建一个扩展我希望它能够在任何网站上找到特定的单词并突出显示它们但是在加载扩展程序后我立即收到一条错误消息有谁知道如何解决这一问题我的代码如下背景 js chrome runtime onIn
ffmpeg drawtext如何设置从右到左的方向

i write arabic text to videos and it works fine but the issue is that the arabic language is written from right to left
使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动

我正在为游戏开发 AI 我想使用MinMax算法与Alpha Beta 修剪我对它的工作原理有一个粗略的了解但我仍然无法从头开始编写代码所以我花了两天的时间在网上寻找某种伪代码我的问题是我在网上找到的每个伪代码似乎都是基于寻找最佳

使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动

使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动 的相关文章

随机推荐

热门标签

使用 MinMax 和 Alpha-Beta 剪枝找到最佳移动的相关文章