搜索
下载APP
DouZero为斗地主设计的强化学习框架
认领
关注
0
粉丝
DouZero 是为斗地主设计的强化学习框架(斗地主 AI),从零开始通过自我博弈强化学习来学打斗地主。斗地主十分具有挑战性。它包含合作、竞争、非完全
知识
简介
DouZero 是为斗地主设计的强化学习框架(斗地主 AI),从零开始通过自我博弈强化学习来学打斗地主。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间,并且每一步合法的牌型会非常不一样。DouZero由快手AI平台部开发。安装训练部分的代码是基于GPU...
更多
其它信息
授权协议
Apache
开发语言
Python
操作系统
跨平台
软件类型
开源软件
所属分类
神经网络/人工智能、 机器学习/深度学习
开源组织
无
地区
国产
适用人群
未知
时光轴
里程碑
1
LOG
0
2023
09-26
轻识收录
打卡
我要打卡
我要打卡
评价
0.0
(满分 10 分)
0 个评分
10分
什么是点评分
图片
表情
视频
评价
全部评价( 0)
推荐率 100%
推荐
AdeptRLAI 强化学习框架
Adept 是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:多G
AdeptRLAI 强化学习框架
Adept是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:多GPU训练使用自定义网络,代理和环境的模块化界面PyTorch的基线强化学习模型和算法内置张量板日志记录
CoachPython 强化学习研究框架
Coach 是 Intel Nervana 开源的一个强化学习研究框架,包含许多最先进的算法的实现。
MindSpore Reinforcement强化学习框架
MindSporeReinforcement是一个开源的强化学习框架,支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的AP
CoachPython 强化学习研究框架
Coach是Intel Nervana开源的一个强化学习研究框架,包含许多最先进的算法的实现。该框架利用多核CPU处理能力,用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线
RL CoachPython 强化学习框架
RLCoach是一个Python强化学习框架,由英特尔2017年推出,包含许多最先进算法的实现。RLCoach只是英特尔真正的人工智能生态系统中的几个工具之一。它以模块化的方式对代理和环境之间的交互进
RL CoachPython 强化学习框架
RL Coach 是一个Python 强化学习框架,由英特尔 2017 年推出,包含许多最先进算法的
PARL高性能强化学习框架
PARL是一个高性能、灵活的强化学习框架。PARL的目标是构建一个可以完整复杂任务的智能体。下载安装命令##CPU版本安装命令pipinstall-fhttps://paddlepaddle.org.
PARL高性能强化学习框架
PARL 是一个高性能、灵活的强化学习框架。PARL 的目标是构建一个可以完整复杂任务的智能体。下载
MindSpore Reinforcement强化学习框架
MindSpore Reinforcement是一个开源的强化学习框架,支持使用强化学习算法对age
10分