推理模型离线转换 — MindSpore Lite master 文档

link管理
链接快照平台
输入网页链接，自动生成快照
标签化管理网页链接
Linux环境使用说明 

环境准备 

使用MindSpore Lite云侧推理模型转换工具，需要进行如下环境准备工作。
编译或下载模型转换工具。
将转换工具需要的动态链接库加入环境变量LD_LIBRARY_PATH。
export LD_LIBRARY_PATH=${PACKAGE_ROOT_PATH}/tools/converter/lib:${LD_LIBRARY_PATH}
${PACKAGE_ROOT_PATH}是编译或下载得到的包解压后的路径。
    └── converter
        ├── include                            # 自定义算子、模型解析、节点解析、转换优化注册头文件
        ├── converter                          # 模型转换工具
        │   └── converter_lite                 # 可执行程序
        └── lib                                # 转换工具依赖的动态库
            ├── libmindspore_glog.so.0         # Glog动态库
            ├── libascend_pass_plugin.so       # 注册昇腾后端图优化插件动态库
            ├── libmslite_shared_lib.so        # 适配昇腾后端的动态库
            ├── libmindspore_converter.so      # 模型转换动态库
            ├── libmslite_converter_plugin.so  # 模型转换插件
            ├── libmindspore_core.so           # MindSpore Core动态库
            ├── libopencv_core.so.4.5          # OpenCV的动态库
            ├── libopencv_imgcodecs.so.4.5     # OpenCV的动态库
            └── libopencv_imgproc.so.4.5       # OpenCV的动态库
        ├── third_party                        # 第三方模型proto定义  
参数说明
MindSpore Lite云侧推理模型转换工具提供了多种参数设置，用户可根据需要来选择使用。此外，用户可输入./converter_lite --help获取实时帮助。
下面提供详细的参数说明。
--help
打印全部帮助信息。
--fmk=<FMK>
输入模型的原始格式。
MINDIR、CAFFE、TFLITE、TF、ONNX
--modelFile=<MODELFILE>
输入模型的路径。
--outputFile=<OUTPUTFILE>
输出模型的路径，不需加后缀，可自动生成.mindir后缀。
--weightFile=<WEIGHTFILE>
转换Caffe模型时必选
输入模型weight文件的路径。
--configFile=<CONFIGFILE>
1）可作为训练后量化配置文件路径；2）可作为扩展功能配置文件路径。
--inputShape=<INPUTSHAPE>
设定模型输入的维度，输入维度的顺序和原始模型保持一致。对某些特定的模型可以进一步优化模型结构，但是转化后的模型将可能失去动态shape的特性。多个输入用;分割，同时加上双引号""。
e.g.  "inTensorName_1: 1,32,32,4;inTensorName_2:1,64,64,4;"
--saveType=<SAVETYPE>
设定导出的模型为mindir模型或者ms模型。
MINDIR、MINDIR_LITE
MINDIR
云侧推理版本只有设置为MINDIR转出的模型才可以推理
--optimize=<OPTIMIZE>
设定转换模型的过程所完成的优化。
none、general、gpu_oriented、ascend_oriented
general
--decryptKey=<DECRYPTKEY>
设定用于加载密文MindIR时的密钥，密钥用十六进制表示，只对fmk为MINDIR时有效。
--decryptMode=<DECRYPTMODE>
设定加载密文MindIR的模式，只在指定了decryptKey时有效。
AES-GCM、AES-CBC
AES-GCM
--encryptKey=<ENCRYPTKEY>
设定导出加密mindir模型的密钥，密钥用十六进制表示。仅支持 AES-GCM，密钥长度仅支持16Byte。
--encryption=<ENCRYPTION>
设定导出mindir模型时是否加密，导出加密可保护模型完整性，但会增加运行时初始化时间。
true、false
--infer=<INFER>
设定是否在转换完成时进行预推理。
true、false
false
--inputDataFormat=<INPUTDATAFORMAT>
设定导出模型的输入format，只对四维输入有效。
NHWC、NCHW
--fp16=<FP16>
设定在模型序列化时是否需要将float32数据格式的权重存储为float16数据格式。
on、off
--inputDataType=<INPUTDATATYPE>
设定量化模型输入tensor的data type。仅当模型输入tensor的量化参数（scale和zero point）齐备时有效。默认与原始模型输入tensor的data type保持一致。
FLOAT32、INT8、UINT8、DEFAULT
DEFAULT
--outputDataType=<OUTPUTDATATYPE>
设定量化模型输出tensor的data type。仅当模型输出tensor的量化参数（scale和zero point）齐备时有效。默认与原始模型输出tensor的data type保持一致。
FLOAT32、INT8、UINT8、DEFAULT
DEFAULT
--device=<DEVICE>
设置转换模型时的目标设备。使用场景是在Ascend设备上，如果你需要转换生成的模型调用Ascend后端执行推理，则设置该参数，若未设置，默认模型调用CPU后端推理。
Ascend、Ascend310、Ascend310P
该选项即将废弃，使用optimize配置ascend_oriented替代
注意事项：
参数名和参数值之间用等号连接，中间不能有空格。
Caffe模型一般分为两个文件：*.prototxt模型结构，对应--modelFile参数；*.caffemodel模型权值，对应--weightFile参数。
configFile配置文件采用key=value的方式定义相关参数。
--optimize该参数是用来设定在离线转换的过程中需要完成哪些特定的优化。如果该参数设置为none，那么在模型的离线转换阶段将不进行相关的图优化操作，相关的图优化操作将会在执行推理阶段完成。该参数的优点在于转换出来的模型由于没有经过特定的优化，可以直接部署到CPU/GPU/Ascend任意硬件后端；而带来的缺点是推理执行时模型的初始化时间增长。如果设置成general，表示离线转换过程会完成通用优化，包括常量折叠，算子融合等（转换出的模型只支持CPU/GPU后端，不支持Ascend后端）。如果设置成gpu_oriented，表示转换过程中会完成通用优化和针对GPU后端的额外优化（转换出来的模型只支持GPU后端）。如果设置成ascend_oriented，表示转换过程中只完成针对Ascend后端的优化（转换出来的模型只支持Ascend后端）。
加解密功能仅在编译时设置为MSLITE_ENABLE_MODEL_ENCRYPTION=on时生效，并且仅支持Linux x86平台。其中密钥为十六进制表示的字符串，如密钥定义为b'0123456789ABCDEF'对应的十六进制表示为30313233343536373839414243444546，Linux平台用户可以使用xxd工具对字节表示的密钥进行十六进制表达转换。需要注意的是，加解密算法在1.7版本进行了更新，导致新版的Python接口不支持对1.6及其之前版本的MindSpore Lite加密导出的模型进行转换。
针对MindSpore模型，由于已经是mindir模型，建议两种做法：
不需要经过离线转换，直接进行推理执行。
使用离线转换，CPU/GPU后端设置–optimize为general（使能通用优化），GPU后端设置–optimize为gpu_oriented（在通用优化的基础上，使能针对GPU的额外优化），NPU后端设置–optimize为ascend_oriented，在离线阶段完成相关优化，减少推理执行的初始化时间。
以Caffe模型LeNet为例，执行转换命令。
./converter_lite --fmk=CAFFE --saveType=MINDIR --optimize=none --modelFile=lenet.prototxt --weightFile=lenet.caffemodel --outputFile=lenet
本例中，因为采用了Caffe模型，所以需要模型结构、模型权值两个输入文件。再加上其他必需的fmk类型和输出路径两个参数，即可成功执行。
结果显示为：
CONVERT RESULT SUCCESS:0
这表示已经成功将Caffe模型转化为MindSpore Lite云侧推理模型，获得新文件lenet.mindir。
以MindSpore、TensorFlow Lite、TensorFlow和ONNX模型为例，执行转换命令。
MindSpore模型model.mindir
./converter_lite --fmk=MINDIR --saveType=MINDIR --optimize=general --modelFile=model.mindir --outputFile=model
TensorFlow Lite模型model.tflite
./converter_lite --fmk=TFLITE --saveType=MINDIR --optimize=none --modelFile=model.tflite --outputFile=model
TensorFlow模型model.pb
./converter_lite --fmk=TF --saveType=MINDIR --optimize=none --modelFile=model.pb --outputFile=model
ONNX模型model.onnx
./converter_lite --fmk=ONNX --saveType=MINDIR --optimize=none --modelFile=model.onnx --outputFile=model
以上几种情况下，均显示如下转换成功提示，且同时获得model.mindir目标文件。
CONVERT RESULT SUCCESS:0