Tengine 调试时参数配置及输出
1.支持3种精度数据,即fp32、fp16、int8
KERNEL_MODE=0 #float32 默认

KERNEL_MODE=1 #float16

KERNEL_MODE=2 #int8

2.可以以功能模式/性能模式运行,功能模式用来检验结果,性能模式针对某个模块加速。
OPS_REGISTRY=reference
功能,全部不优化,标准结果。

OP_NAME=Convolution
性能,卷积加速,结果与标准结果比较,没有偏差

3.每个节点耗时可以按节点顺序或时间顺序排序
export PROF_TIME=1 按时间升序排列

export DEBUG_G=1 按节点升序排列

4.输出每个节点的详细信息
在./driver/cpu/cpu_runner.cpp 文件中,去掉#define DUMP_NODE_OUTPUT前的注释 ,重新编译即可输出每个节点的输出信息。
./linux_build.sh default_config/x86_linux_native.config
./build/benchmark/bin/bench_sqz

出现上述问题的原因是没有创建目录/tmp/debug/
只需要mkdir /tmp/debug 即可,然后/tmp/debug目录下即可看到输出文件。
![]()
版权声明:本文为u014638655原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。