DouZero为斗地主设计的强化学习框架认领

0粉丝

DouZero 是为斗地主设计的强化学习框架（斗地主 AI），从零开始通过自我博弈强化学习来学打斗地主。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间，并且每一步合法的牌型会非常不一样。DouZero由快手AI平台部开发。安装训练部分的代码是基于GPU

简介

DouZero 是为斗地主设计的强化学习框架（斗地主 AI），从零开始通过自我博弈强化学习来学打斗地主。斗地主十分具有挑战性。它包含合作、竞争、非完全信息、庞大的状态空间。斗地主也有非常大的动作空间，并且每一步合法的牌型会非常不一样。DouZero由快手AI平台部开发。安装训练部分的代码是基于GPU... 更多

技术信息

开源协议

Apache

开发语言

Python

操作系统

跨平台

软件类型

开源软件

所属分类

神经网络/人工智能、机器学习/深度学习

开源组织

无

地区

国产

适用人群

未知

时光轴

里程碑1

LOG0

2023

09-26

轻识收录

打卡

评价

0.0（满分 10 分）0 个评分

什么是点评分

图片

表情

全部评价( 0)

推荐率 100%

推荐

AdeptRLAI 强化学习框架

Adept 是一种强化学习框架，旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供：多G

AdeptRLAI 强化学习框架

Adept是一种强化学习框架，旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供：多GPU训练使用自定义网络，代理和环境的模块化界面PyTorch的基线强化学习模型和算法内置张量板日志记录

CoachPython 强化学习研究框架

Coach 是 Intel Nervana 开源的一个强化学习研究框架，包含许多最先进的算法的实现。

MindSpore Reinforcement强化学习框架

MindSporeReinforcement是一个开源的强化学习框架，支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的AP

CoachPython 强化学习研究框架

Coach是Intel Nervana开源的一个强化学习研究框架，包含许多最先进的算法的实现。该框架利用多核CPU处理能力，用于训练和评估增强学习Agent。Coach包含一些领先的增强学习算法的多线

RL CoachPython 强化学习框架

RLCoach是一个Python强化学习框架，由英特尔2017年推出，包含许多最先进算法的实现。RLCoach只是英特尔真正的人工智能生态系统中的几个工具之一。它以模块化的方式对代理和环境之间的交互进

RL CoachPython 强化学习框架

RL Coach 是一个Python 强化学习框架，由英特尔 2017 年推出，包含许多最先进算法的

PARL高性能强化学习框架

PARL是一个高性能、灵活的强化学习框架。PARL的目标是构建一个可以完整复杂任务的智能体。下载安装命令##CPU版本安装命令pipinstall-fhttps://paddlepaddle.org.

PARL高性能强化学习框架

PARL 是一个高性能、灵活的强化学习框架。PARL 的目标是构建一个可以完整复杂任务的智能体。下载

MindSpore Reinforcement强化学习框架

MindSpore Reinforcement是一个开源的强化学习框架，支持使用强化学习算法对age