如何用强化学习设计一个能玩五子棋的AI?

Python与算法之美

共 707字,需浏览 2分钟

 ·

2021-04-14 21:10

还记2015年大战李世石和柯洁的阿尔法狗吗?你是否想过自己动手计训练个能下棋的AI呢?我的好友写了一个系列文章来教你从LeetCode道题的题解开始,逐步理解和实现一个能下井字棋和五子棋强化学习AI文章链接如下。

感兴趣的小伙伴欢迎关注敏哥的公众号get相应资源😋😋!

下面是敏哥更多的强化学习相关原创文章和视频。

深度强化学习实践系列

深度强化学习之:PPO训练红白机1942

组合游戏系列5: 井字棋、五子棋AlphaGo Zero 算法实战

经典论文解读系列

解读深度强化学习基石论文:函数近似的策略梯度方法


解读TRPO论文,深度强化学习结合传统优化方法


Sutton 强化学习教程动手系列

通过代码学Sutton强化学习4:21点游戏蒙特卡洛解得最佳策略


通过代码学Sutton强化学习:从Q-Learning 演化到 DQN


经典论文视频解读系列

视频论文解读:PPO算法


【英语】Pointer Networks 论文解读:RNN解组合优化



浏览 139
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报