EDL弹性深度学习框架联合创作 · 2023-09-26 05:19EDL 是一个弹性深度学习框架,其包含一个 KubernetesController、PaddlePaddle auto-scaler(可以根据集群中的空闲硬件资源改变分布式任务进程的数目)以及一个新的容错计算架构。 该项目致力于解决深度学习任务弹性的在资源通常不足的生产环境集群执行,尽可能早的帮助深度学习开发者分析出潜在算法问题,同时,Fluid 通过 API 与 Kubernetes 交互,以理解全局集群状态,并据此调整不同任务的进程数量。浏览 7点赞 评论 收藏 分享 手机扫一扫分享 编辑 分享 举报 评论图片表情视频评价全部评论推荐 Mrdflow深度学习框架MrdFlow 的定位是基于 NumPy 的深度学习框架,采用自动微分作为求导算法,支持多种运算求导Caffe深度学习框架Caffe 是一个深度学习框架,由表达式,速度和模块化组成。Caffe 是 Berkeley VisCaffe深度学习框架Caffe是一个深度学习框架,由表达式,速度和模块化组成。Caffe是BerkeleyVisionandLearningCenter(BVLC)社区贡献者开发的。在线演示:http://demo.ca聊聊深度学习框架Jack Cui0Mrdflow深度学习框架MrdFlow的定位是基于NumPy的深度学习框架,采用自动微分作为求导算法,支持多种运算求导。MrdFlow内置神经网络模块,可以使用MrdFlow提供的Api,编写神经网络,并进行训练。软件地址:ElasticDLKubernetes 原生深度学习框架ElasticDL是一个基于TensorFlow2.0构建的Kubernetes原生深度学习框架,支持容错和弹性调度。TensorFlow具有故障可恢复的原生分布式计算功能,在某些进程挂掉的情况下,分MegEngine(天元)深度学习框架MegEngine(天元)是一个快速,可扩展,易于使用且支持自动求导的深度学习框架,中文名为“天元”,是旷视AI战略的重要组成部分,负责AI三要素(算法,算力,数据)中的“算法”。特点:一是“训练推理OneFlow通用深度学习框架OneFlow 是一个采用全新架构设计的工业级通用深度学习框架。OneFlow 率先提出了静态调度和HorovodTensorFlow 分布式深度学习框架Horovod是Uber开源的针对 TensorFlow 的分布式深度学习框架,旨在使分布式深度学习更快速,更易于使用。Horovod吸取了Facebook的 TrainingImageNetin1H深度学习框架这几年机器学习实验室0点赞 评论 收藏 分享 手机扫一扫分享 编辑 分享 举报