实践教程 | 轻松入门模型转换和可视化-技术圈

↑ 点击蓝字关注极市平台

作者 | 爱做菜的炼丹师
来源 | CV研习社
编辑 | 极市平台

极市导读

本文给大家介绍一个模型转换格式ONNX和可视化工具Netron。ONNX是微软设计的一种多平台的通用文件格式，帮助算法人员进行模型部署和框架之间相互转换。而Netron是一款老牌的轻量化模型可视化工具，支持多种开源框架，使用上比TensorBoard简单直接。 >>加入极市CV技术交流群，走在计算机视觉的最前沿

1 不同框架模型需要转换吗？

目前开源的深度学习框架有很多，当我们在Github上搜索一个通用网络时，会发现各种各样的版本实现。但是深度学习方法的本质都是分为训练和部署两个环节，如果以目标为导向，我们关注算法部署在哪儿，用什么部署？是x86上采样TensorRT部署还是ARM上采用端框架NCNN运行，又或者采样某个硬件厂商提供的SDK做推理。

假设童鞋A有一个检测任务需要部署在TX2的开发板上，基于TensorFlow框架把yolov5改改，训练得到了一份pb权重，接下来将pb转换成TensorRT使用的uff文件做推理。

如果A将框架换成Pytorch，按照上述流程得到了一份pt的权重，然后调用TensorRT的SDK转换成uff格式，看上去好像也很顺畅没什么问题，它们的区别就在于训练生成的权重文件格式不同，不过反正最终都转换成uff格式。

实际操作中或者部署在其他移动端时，我们会发现瓶颈在于如何才能更友好的将PC端训练的权重文件转换成部署端需要的格式。Nividia的开发板虽然基于CUDA加速，生态链完整，但是对不同的神经网络框架支持的算子力度也有区别，如果训练框架是Pytorch，在TensorRT上部署，如下图所示理论上有三条路（这里Caffe的存在是因为TRT对它的支持更友好，可以根据需求删除）：

直接调用TRT提供的SDK转换接口，很大可能遇到不支持的操作算子，在Nividia显卡上还能通过CUDA编程自定义算法，换成其他硬件可能直接就不支持自定义功能。

既然直接转换走不通，那么能否将Pytorch先转成Caffe，再由Caffe转到TRT呢？

这条路也存在问题，不同神经网络框架在一些定义上存在差异，比如Pytorch的反卷积自带两次padding；最大池化时Pytorch向下取整，而Caffe向上取整等等。细节上的问题会导致转换后输出不同。

所以我们可以看到图上那条更迂回的路，经过ONNX这个较为通用的格式，因为Pytorch—>ONNX—>Caffe—>TensorRT从部署角度看才更可行。

2 什么是ONNX？

ONNX是一套神经网络模型的开放格式，支持Core ML, PaddlePaddle, SNPE, MXNet, Caffe2, PyTorch, TensorFlow, CNTK 等框架。

ONNX的安装比较简单，在Ubuntu上直接pip install onnx即可，从图上可以看出它是依赖Protobuf库的，因为它内部采用的是Protobuf作为其数据存储和传输。

ONNX是一种可扩展的计算图模型、一系列内置的运算单元和标准数据类型。每一个计算流图都定义为由节点组成的列表，并构建有向无环图。其中每一个节点都有一个或多个输入与输出，每一个节点称之为一个运算单元。这相当于一种通用的计算图，不同深度学习框架构建的计算图都能转化为它。

为什么要把训练的模型转换成ONNX？

ONNX的作用是在五花八门的训练框架和屈指可数的部署方案之间建立桥梁。它是一个中间环节，方便模型的部署和在各个框架之间转移。

试下如果你电脑上是Tensorflow的环境，却发现最新的开源模型是用Pytorch写的，你想快速测试效果怎么办？

采用TensorFlow重写一遍吗？肯定不行，先不说实现后性能是否一致，单就花费的时间成本就很高。

那么配置一份Pytorch的运行环境跑一下结果？看起来可行，但是下一次是Caffe，CoreML呢？难不成都配置一遍吗！

再想想办法，写个脚本将Pytorch的权重转成TensorFlow的pb文件？好像也可以，但是实际操作下来会发现不同框架直接的直接转换有许多细节上的不统一。

最后大家商量一个共同使用的中间接口过度不就可以了，微软开发的ONNX因此出现了。

还有一种部署的场景是当用某个开源框架训练的模型文件转换到ONNX后，还需要将它再次转换，比如转换到TensorRT后做前向传播。为什么要转换这么多次呢？

我们反过来看就清楚了，目标平台支持哪个框架力度大，我们就通过ONNX做为中转站将当前的框架模型转换到支持算子多的框架，为了让算法在移动端部署成功。

如何转换ONNX？

这里以tensorflow为例，从tf转到onnx还处于实验阶段，我们可以依靠外部工具进行转换。

首先第一步需要安装tf2onnx包，即pip install -U tf2onnx。

然后第二步将ckpt文件冻结成pb文件，这里是因为ckpt和meta文件分别权重信息和拓扑结构分开存储，而且固化到pb中是将变量冻结成常量形式。TensorFlow官方已经提过了相关工具freeze_graph。

最后第三部执行tf2onnx.convert命令，即：

python3 -m tf2onnx.convert --input model.pb --inputs input_name:0[1,640,640,3] --outputs output_name:0 --output model.onnx

其中input_name是网络输入的名称，output_name是网络输出的名称。