Tengine debug设置环境变量的调试方法和输出

Tengine 调试时参数配置及输出

1.支持3种精度数据,即fp32、fp16、int8

KERNEL_MODE=0   #float32  默认

 

KERNEL_MODE=1   #float16

 

KERNEL_MODE=2   #int8

 

2.可以以功能模式/性能模式运行,功能模式用来检验结果,性能模式针对某个模块加速。

OPS_REGISTRY=reference   

功能,全部不优化,标准结果。

 

OP_NAME=Convolution       

性能,卷积加速,结果与标准结果比较,没有偏差

 

3.每个节点耗时可以按节点顺序或时间顺序排序

export PROF_TIME=1 按时间升序排列

 

export DEBUG_G=1   按节点升序排列

 

4.输出每个节点的详细信息

在./driver/cpu/cpu_runner.cpp 文件中,去掉#define DUMP_NODE_OUTPUT前的注释 ,重新编译即可输出每个节点的输出信息。

./linux_build.sh default_config/x86_linux_native.config

./build/benchmark/bin/bench_sqz

出现上述问题的原因是没有创建目录/tmp/debug/

只需要mkdir /tmp/debug 即可,然后/tmp/debug目录下即可看到输出文件。

 


版权声明:本文为u014638655原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。