TonY构建在 Hadoop YARN 上的 TensorFlow 框架
TensorFlow on YARN (TonY) 是一个构建在 Hadoop YARN 上的 TensorFlow 框架。
TonY 可以将单节点或分布式 TensorFlow 训练作为 Hadoop 应用程序运行。此原生连接器与其他 TonY 功能一起,旨在可靠,灵活地运行 TensorFlow 训练。
在 YARN 的 TonY 上运行 TensorFlow
TonY 的架构
TonY 主要包含三个要素:Client、ApplicationMaster 和 TaskExecutor。运行 TonY 作业的端到端处理过程如下:
-
用户向 Client 提交 TensorFlow 模型训练代码、参数及其 Python 虚拟环境(包含 TensorFlow 依赖)。
-
Client 设置 ApplicationMaster(AM)并将其提交给 YARN 集群。
-
AM 与 YARN 基于用户资源请求的资源管理(Resource Manager)进行资源协商(参数服务器及线程、内存和 GPU 的数量)。
-
一旦 AM 收到分配,它就会在分配的节点上生成 TaskExecutor。
-
TaskExecutor 启动用户的训练代码并等待其完成。
-
用户的训练代码启动,TonY 定期在 TaskExecutor 和 AM 之间跳动,以检查其活性。
评论
Nutlucene + hadoop 分布式运行框架
Nut 是一个为lucene提供分布式搜索的框架。理论上可对千G以上索引文件支持数千万级的用户搜索访
Nutlucene + hadoop 分布式运行框架
0
Nutlucene + hadoop 分布式运行框架
Nut是一个为lucene提供分布式搜索的框架。理论上可对千G以上索引文件支持数千万级的用户搜索访问。Nut由Client、Server、Cache和DB四部分构成。Client处理用户请求和对搜索结
Nutlucene + hadoop 分布式运行框架
0
Dopamine基于 Tensorflow 的强化学习框架
Dopamine 是由 Google AI 实验室推出的一个基于 Tensorflow 的强化学习(
Dopamine基于 Tensorflow 的强化学习框架
0
Dopamine基于 Tensorflow 的强化学习框架
Dopamine是由GoogleAI实验室推出的一个基于Tensorflow的强化学习(RL)框架,旨在为新手和资深RL研究人员提供灵活性、稳定性和可重复性。该框架受大脑中的奖励动机行为启发,反映了神
Dopamine基于 Tensorflow 的强化学习框架
0
Lingvo在 Tensorflow 中构建神经网络的框架
Lingvo是一个用于在Tensorflow中构建神经网络的框架,特别是序列模型。快速开始安装设置Lingvo有两种方法:通过pip安装固定版本,或者克隆仓库并使用bazel构建它。Lingvo 为每
Lingvo在 Tensorflow 中构建神经网络的框架
0