onnxruntime编译选项解析

enable_nvtx_profile:在ORT使用NVTX profileNVTXNVIDIA® Tools Extension SDK)是一个提供事件注解,编码ranges和资源的c接口程序库

 

use_horovod:使用horovodHorovodUber开源的基于Ring-AllReduce方法的深度学习分布式训练工具,以支持多种流行架构包括TensorFlowKerasPyTorch等

 

msvc_toolset:使用msvc工具集。msvc是微软的编译器vc

 

use_xcode:使用xcodexcodeMac OS上的集成开发工具(IDE)

 

use_jemalloc:使用jemallocJeMalloc 是一款内存分配器,与其它内存分配器相比,它最大的优势在于多线程情况下的高性能以及内存碎片的减少。

 

use_mimalloc:使用mimallocmimalloc是具有出色性能特征的通用内存分配器,用于KokaLean语言的运行时系统

 

use_openblas:使用openblasBLASBasic Linear Algebra Subprograms基础线性代数程序集)是一个应用程序接口(API)标准,用以规范发布基础线性代数操作的数值库(矩阵运算库),BLAS:标准实现(FortranCBLASCBLAS标准实现Atlas:一种优化实现GotoBLAS:多线程性能良好的优化实现(已停止更新)OpenBLAS:目前性能最好的开源实现,基于GotoBLASMKLIntel实现,在Intel处理器上性能最佳

 

use_dnnl:使用dnnlDnnlIntel开发的高性能深度学习优化库,此前叫做MKL-DNN。

use_mklml:使用mklmlMklmlMKL中面向机器学习的部分

 

use_featurizers:使用ML FeaturizerML Featurizeradobe开发的用于特征工程中从数据中快速提取补充特征的库

use_ngraph:使用ngraphnGraphintel开源的,面向各种设备和框架的深度神经网络模型编译器,减少将模型部署到各种设备训练和运行的工作量

 

use_openvino:使用openvinoOpenVINO是英特尔基于自身现有的硬件平台开发的一种可以加快高性能计算机视觉和深度学习视觉应用开发速度工具套件,支持各种英特尔平台的硬件加速器上进行深度学习,并且允许直接异构执行,拥有算法模型上线部署的各种能力

 

use_nnapi:使用nnapiAndroid Neural Networks API (NNAPI)是一个基于Android系统的用于可在移动设备上运行与机器学习相关的计算密集型操作的C语言APINNAPI将为更高层次的可构建和训练神经网络的机器学习框架(如TensorFLow Lite, Caffe2, 等等)提供底层支持。

 

use_openmp:使用openmp。


版权声明:本文为zhuikefeng原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。