tensorflow如何继续训练之前保存的模型(断点续训)(断点训练)

一、TensorFlow常规模型加载方法

checkpoint文件会记录保存信息,通过它可以定位最新保存的模型:

1

2

ckpt = tf.train.get_checkpoint_state('./model/')

print(ckpt.model_checkpoint_path)

 

.meta文件保存了当前图结构

.index文件保存了当前参数名

.data文件保存了当前参数值

可能是你加载checkpoint的代码有问题,你可以检查一下代码是否使用sess.run(tf.global_variable_initializer()),这会使restore graph的过程实际上并没有使用checkpoint中保存的变量值,而是使用了默认的初始化值。

作者:OjoRojo
链接:https://www.zhihu.com/question/68078055/answer/699486175
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

明成那个版本的是在 args.py里修改 restore_path 为 checkpoint 文件夹里某个 best_model ,然后在pycharm终端

敲入 python train.py 就可以接着前面的数据训练了

 

 

另外几篇值得参考的文章:

(14条消息)Tensorflow笔记__实现断点续训功能_人工智能_Pichairen-CSDN博客

(14条消息)TensorFlow实现模型断点训练,checkpoint模型载入_人工智能_Sesen的木屋-CSDN博客


版权声明:本文为txpp520原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。