如何用强化学习设计一个能玩五子棋的AI？

Python与算法之美

共 707字，需浏览 2分钟

·

2021-04-14 21:10

还记得2015年大战李世石和柯洁的阿尔法狗吗？你是否想过自己动手设计训练一个能下棋的AI呢？我的好友敏哥写了一个系列文章来教你从LeetCode一道题的题解开始，逐步理解和实现一个能下井字棋和五子棋的强化学习AI。文章链接如下。

第一篇: Leetcode中的Minimax 和 Alpha Beta剪枝
第二篇: 井字棋Leetcode系列题解和Minimax最佳策略实现
第三篇: 井字棋、五子棋的OpenAI Gym GUI环境
第四篇: AlphaGo Zero 强化学习算法原理深度分析
第五篇: 井字棋、五子棋AlphaGo Zero 算法实战

感兴趣的小伙伴欢迎关注敏哥的公众号get相应资源😋😋！

下面是敏哥更多的强化学习相关原创文章和视频。

深度强化学习实践系列

深度强化学习之：PPO训练红白机1942

组合游戏系列5: 井字棋、五子棋AlphaGo Zero 算法实战

经典论文解读系列

解读深度强化学习基石论文：函数近似的策略梯度方法

解读TRPO论文，深度强化学习结合传统优化方法

Sutton 强化学习教程动手系列

通过代码学Sutton强化学习4：21点游戏蒙特卡洛解得最佳策略

通过代码学Sutton强化学习：从Q-Learning 演化到 DQN

经典论文视频解读系列

视频论文解读：PPO算法

【英语】Pointer Networks 论文解读：RNN解组合优化

浏览 188

点赞

收藏

分享

举报

评论

图片

表情

如何用深度强化学习自动炒股

机器学习AI算法工程

如何用 Python 写一个 AI 贪吃蛇

作者：Hawstein。（本文阅读需要约 9 分钟）小帅b 前言这两天在网上看到一张让人涨姿势的图片，图片中展示的是贪吃蛇游戏，估计大部分人都玩过。但如果仅仅是贪吃蛇游戏，那么它就没有什么让人涨姿势的地方了。...

如何用AI设计一家淘宝小店？

如何用Python写一个贪吃蛇？

Python 知识大全

DouZero为斗地主设计的强化学习框架

DouZero是为斗地主设计的强化学习框架（斗地主AI），从零开始通过自我博弈强化学习来学打斗地主。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间，并且

DouZero为斗地主设计的强化学习框架

DouZero 是为斗地主设计的强化学习框架（斗地主 AI），从零开始通过自我博弈强化学习来学打斗地

如何用OKR搞垮一个团队？

博文视点Broadview

如何用CSS实现一个搜索引擎？

Python涨薪研究所

如何用OKR搞垮一个团队？

前端下午茶

如何用OpenCV制作一个低成本的立体相机

小白学视觉

点赞

收藏

分享

举报