添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
相关文章推荐
孤独的双杠  ·  《吞食天地3 ...·  1 周前    · 
近视的充电器  ·  Wise ...·  6 月前    · 

MindSpore Lite云侧推理提供离线转换模型功能的工具,支持多种类型的模型转换,转换后的模型可用于推理。命令行参数包含多种个性化选项,为用户提供方便的转换途径。

目前支持的输入格式有:MindSpore、TensorFlow Lite、Caffe、TensorFlow和ONNX。

通过转换工具转换成的 mindir 模型,支持转换工具配套及更高版本的Runtime推理框架执行推理。

Linux环境使用说明

环境准备

使用MindSpore Lite云侧推理模型转换工具,需要进行如下环境准备工作。

  • 编译 下载 模型转换工具。

  • 将转换工具需要的动态链接库加入环境变量LD_LIBRARY_PATH。

    export LD_LIBRARY_PATH=${PACKAGE_ROOT_PATH}/tools/converter/lib:${LD_LIBRARY_PATH}
    

    ${PACKAGE_ROOT_PATH}是编译或下载得到的包解压后的路径。

    └── converter ├── include # 自定义算子、模型解析、节点解析、转换优化注册头文件 ├── converter # 模型转换工具 │ └── converter_lite # 可执行程序 └── lib # 转换工具依赖的动态库 ├── libmindspore_glog.so.0 # Glog动态库 ├── libascend_pass_plugin.so # 注册昇腾后端图优化插件动态库 ├── libmslite_shared_lib.so # 适配昇腾后端的动态库 ├── libmindspore_converter.so # 模型转换动态库 ├── libmslite_converter_plugin.so # 模型转换插件 ├── libmindspore_core.so # MindSpore Core动态库 ├── libopencv_core.so.4.5 # OpenCV的动态库 ├── libopencv_imgcodecs.so.4.5 # OpenCV的动态库 └── libopencv_imgproc.so.4.5 # OpenCV的动态库 ├── third_party # 第三方模型proto定义

    参数说明

    MindSpore Lite云侧推理模型转换工具提供了多种参数设置,用户可根据需要来选择使用。此外,用户可输入./converter_lite --help获取实时帮助。

    下面提供详细的参数说明。

    --help

    打印全部帮助信息。

    --fmk=<FMK>

    输入模型的原始格式。

    MINDIR、CAFFE、TFLITE、TF、ONNX

    --modelFile=<MODELFILE>

    输入模型的路径。

    --outputFile=<OUTPUTFILE>

    输出模型的路径,不需加后缀,可自动生成.mindir后缀。

    --weightFile=<WEIGHTFILE>

    转换Caffe模型时必选

    输入模型weight文件的路径。

    --configFile=<CONFIGFILE>

    1)可作为训练后量化配置文件路径;2)可作为扩展功能配置文件路径。

    --inputShape=<INPUTSHAPE>

    设定模型输入的维度,输入维度的顺序和原始模型保持一致。对某些特定的模型可以进一步优化模型结构,但是转化后的模型将可能失去动态shape的特性。多个输入用;分割,同时加上双引号""

    e.g. "inTensorName_1: 1,32,32,4;inTensorName_2:1,64,64,4;"

    --saveType=<SAVETYPE>

    设定导出的模型为mindir模型或者ms模型。

    MINDIR、MINDIR_LITE

    MINDIR

    云侧推理版本只有设置为MINDIR转出的模型才可以推理

    --optimize=<OPTIMIZE>

    设定转换模型的过程所完成的优化。

    none、general、gpu_oriented、ascend_oriented

    general

    --decryptKey=<DECRYPTKEY>

    设定用于加载密文MindIR时的密钥,密钥用十六进制表示,只对fmk为MINDIR时有效。

    --decryptMode=<DECRYPTMODE>

    设定加载密文MindIR的模式,只在指定了decryptKey时有效。

    AES-GCM、AES-CBC

    AES-GCM

    --encryptKey=<ENCRYPTKEY>

    设定导出加密mindir模型的密钥,密钥用十六进制表示。仅支持 AES-GCM,密钥长度仅支持16Byte。

    --encryption=<ENCRYPTION>

    设定导出mindir模型时是否加密,导出加密可保护模型完整性,但会增加运行时初始化时间。

    true、false

    --infer=<INFER>

    设定是否在转换完成时进行预推理。

    true、false

    false

    --inputDataFormat=<INPUTDATAFORMAT>

    设定导出模型的输入format,只对四维输入有效。

    NHWC、NCHW

    --fp16=<FP16>

    设定在模型序列化时是否需要将float32数据格式的权重存储为float16数据格式。

    on、off

    --inputDataType=<INPUTDATATYPE>

    设定量化模型输入tensor的data type。仅当模型输入tensor的量化参数(scale和zero point)齐备时有效。默认与原始模型输入tensor的data type保持一致。

    FLOAT32、INT8、UINT8、DEFAULT

    DEFAULT

    --outputDataType=<OUTPUTDATATYPE>

    设定量化模型输出tensor的data type。仅当模型输出tensor的量化参数(scale和zero point)齐备时有效。默认与原始模型输出tensor的data type保持一致。

    FLOAT32、INT8、UINT8、DEFAULT

    DEFAULT

    --device=<DEVICE>

    设置转换模型时的目标设备。使用场景是在Ascend设备上,如果你需要转换生成的模型调用Ascend后端执行推理,则设置该参数,若未设置,默认模型调用CPU后端推理。

    Ascend、Ascend310、Ascend310P

    该选项即将废弃,使用optimize配置ascend_oriented替代

    注意事项:

  • 参数名和参数值之间用等号连接,中间不能有空格。

  • Caffe模型一般分为两个文件:*.prototxt模型结构,对应--modelFile参数;*.caffemodel模型权值,对应--weightFile参数。

  • configFile配置文件采用key=value的方式定义相关参数。

  • --optimize该参数是用来设定在离线转换的过程中需要完成哪些特定的优化。如果该参数设置为none,那么在模型的离线转换阶段将不进行相关的图优化操作,相关的图优化操作将会在执行推理阶段完成。该参数的优点在于转换出来的模型由于没有经过特定的优化,可以直接部署到CPU/GPU/Ascend任意硬件后端;而带来的缺点是推理执行时模型的初始化时间增长。如果设置成general,表示离线转换过程会完成通用优化,包括常量折叠,算子融合等(转换出的模型只支持CPU/GPU后端,不支持Ascend后端)。如果设置成gpu_oriented,表示转换过程中会完成通用优化和针对GPU后端的额外优化(转换出来的模型只支持GPU后端)。如果设置成ascend_oriented,表示转换过程中只完成针对Ascend后端的优化(转换出来的模型只支持Ascend后端)。

  • 加解密功能仅在编译时设置为MSLITE_ENABLE_MODEL_ENCRYPTION=on时生效,并且仅支持Linux x86平台。其中密钥为十六进制表示的字符串,如密钥定义为b'0123456789ABCDEF'对应的十六进制表示为30313233343536373839414243444546,Linux平台用户可以使用xxd工具对字节表示的密钥进行十六进制表达转换。需要注意的是,加解密算法在1.7版本进行了更新,导致新版的Python接口不支持对1.6及其之前版本的MindSpore Lite加密导出的模型进行转换。

  • 针对MindSpore模型,由于已经是mindir模型,建议两种做法:

    不需要经过离线转换,直接进行推理执行。

    使用离线转换,CPU/GPU后端设置–optimize为general(使能通用优化),GPU后端设置–optimize为gpu_oriented(在通用优化的基础上,使能针对GPU的额外优化),NPU后端设置–optimize为ascend_oriented,在离线阶段完成相关优化,减少推理执行的初始化时间。

  • 以Caffe模型LeNet为例,执行转换命令。

    ./converter_lite --fmk=CAFFE --saveType=MINDIR --optimize=none --modelFile=lenet.prototxt --weightFile=lenet.caffemodel --outputFile=lenet
    

    本例中,因为采用了Caffe模型,所以需要模型结构、模型权值两个输入文件。再加上其他必需的fmk类型和输出路径两个参数,即可成功执行。

    结果显示为:

    CONVERT RESULT SUCCESS:0
    

    这表示已经成功将Caffe模型转化为MindSpore Lite云侧推理模型,获得新文件lenet.mindir

  • 以MindSpore、TensorFlow Lite、TensorFlow和ONNX模型为例,执行转换命令。

  • MindSpore模型model.mindir

  • ./converter_lite --fmk=MINDIR --saveType=MINDIR --optimize=general --modelFile=model.mindir --outputFile=model
    
  • TensorFlow Lite模型model.tflite

  • ./converter_lite --fmk=TFLITE --saveType=MINDIR --optimize=none --modelFile=model.tflite --outputFile=model
    
  • TensorFlow模型model.pb

  • ./converter_lite --fmk=TF --saveType=MINDIR --optimize=none --modelFile=model.pb --outputFile=model
    
  • ONNX模型model.onnx

  • ./converter_lite --fmk=ONNX --saveType=MINDIR --optimize=none --modelFile=model.onnx --outputFile=model
    

    以上几种情况下,均显示如下转换成功提示,且同时获得model.mindir目标文件。

    CONVERT RESULT SUCCESS:0
    
  •