OpenPPL高性能深度学习推理平台

联合创作 · 2023-09-26 05:57

OpenPPL 是基于自研高性能算子库的推理引擎，拥有极致调优的性能；提供云原生环境下的 AI 模型多后端部署能力，支持 OpenMMLab 等深度学习模型的高效部署。

架构如下：

高性能

设计微架构友好的任务/数据/指令等多级并行策略，自研 NV GPU、 x86 CPU 计算库，满足部署场景对神经网络推理、常用图像处理的性能需求

支持 GPU T4 平台 FP16 推理
支持 CPU x86 平台 FP32 推理
核心算子优化，平均性能领先业界

OpenMMLab 部署

支持 OpenMMLab 检测、分类、分割、超分等系列前沿模型，同时提供模型前后处理所需图像处理算子

遵循 ONNX 开放标准，提供 ONNX 转换支持
支持网络动态特性
提供 MMCV 算子高性能实现

云上多后端部署

面向云端异构推理场景，支持多平台部署

支持 x86 FMA & AVX512、NV Turing 架构
支持异构设备并行推理

浏览 22

点赞

收藏

分享

举报

评论

图片

表情

TensorRT英伟达高性能深度学习推理平台

TensorRT 是一个高性能深度学习推理平台，它包括深度学习推理优化器和运行时，可为深度学习推理应

TensorRT英伟达高性能深度学习推理平台

TensorRT是一个高性能深度学习推理平台，它包括深度学习推理优化器和运行时，可为深度学习推理应用提供低延迟和高吞吐量。在推理期间，基于TensorRT的应用比仅CPU平台的执行速度快40倍。Ten

PlaidML跨平台高性能深度学习框架

PlaidML 致力于跨平台开发部署的开源高性能深度学习框架。一方面可以让硬件开发者快速集成到框架里，一方面也可以让框架的使用者有接入各种硬件的能力。使开发者者能够在任何设备上部署高性能神经网络允许硬

PlaidML跨平台高性能深度学习框架

PlaidML 致力于跨平台开发部署的开源高性能深度学习框架。一方面可以让硬件开发者快速集成到框架里

收藏 | 深度学习到深度推理

机器学习算法与Python实战

XLearning深度学习调度平台

XLearning 是奇虎 360 开源的一款支持多种机器学习、深度学习框架调度系统。基于 Hado

XLearning深度学习调度平台

XLearning 是奇虎360开源的一款支持多种机器学习、深度学习框架调度系统。基于HadoopYarn完成了对TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras

Paddle Lite『飞桨』多平台高性能深度学习预测引擎

PaddleLite为Paddle-Mobile的升级版，定位支持包括手机移动端在内更多场景的轻量化高效预测，支持更广泛的硬件和平台，是一个高性能、轻量级的深度学习预测引擎。在保持和PaddlePad

Forward DL深度学习推理加速框架

Forward是一款腾讯研发并开源的GPU高性能推理加速框架。它提出了一种解析方案，可直接加载主流框架模型（Tensorflow/PyTorch/Keras/ONNX）转换成TensorRT推理加速引

Adlik加速深度学习推理的工具包

Adlik 是深度学习模型的端到端优化框架。Adlik的目标是在云和嵌入式环境中加速深度学习推理过程。使用Adlik框架，不同的深度学习模型可以以非常灵活和简单的方式以高性能部署到不同的平台。在云环境

点赞

收藏

分享

举报