2019/5/5更新
pytorch 1.1 版本相比1.0版本,对 half 训练优化了许多,nan发生的情况少了很多,现在应该可以日常使用 half 训练了
使用Adam优化器时,加入参数eps=1e-4
optimizer1 = optim.Adam(model.parameters(), lr=1e-3, eps=1e-4)
pytorch 半精度浮点数表示的范围比单精度的少很多
- 使网络输入 值域缩放到 [-1, 1] 或 [0, 1]
- 定义Adam优化器时,加入参数eps=1e-3
- 定义RMSprop优化器时,加入参数eps=1e-2
- 降低学习率
optimizer1 = optim.Adam(model.parameters(), lr=0.001, eps=1e-3)
optimizer2 = optim.RMSprop(model.parameters(), lr=0.001, eps=1e-2)
版权声明:本文为ONE_SIX_MIX原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。