最近在做深度学习模型在嵌入式设备上的速率评估,现阶段一般计算深度模型的计算力的单位一般是MACC(Multiply–accumulate),一般评估嵌入式设备的单位是TOPS(Tera Operations Per Second),中文网站很少有介绍两者的关系。在查阅资料后基本可确定是tops=TMACC×2的关系。
具体可看:
https://www.nxp.com/files-static/training_pdf/29147_COLDFIRE_CORES_WBT.pdf
https://github.com/sovrasov/flops-counter.pytorch/issues/16
https://stackoverflow.com/questions/51982752/why-tensorflows-flops-is-2-times-caffes-macc
版权声明:本文为weixin_42107987原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。