在远程的Linux服务器上跑深度学习模型

在远程的服务器上访问visdom的操作 参考链接1 参考链接2

  1. 在本地cmd中用ssh命令远程登录linux服务器,将远程服务器visdom的默认端口8097映射到本地的18097端口,敲入下面的命令后回车

ssh -L 18097:127.0.0.1:8097 username@remote_server_ip

  1. 再打开一个远程linux服务器的窗口,在窗口当中启动visdom服务,敲入下面的命令后回车

python -m visdom.server

  1. 在本地浏览器输入地址,127.0.0.1:18097就能够监控模型训练的数据了。(Note:在使用猎豹浏览器时发现无法接收到传输来的数据,在改用google浏览器之后就没有该问题了)

将训练任务挂在服务器后台一直运行,防止远程连接断开之后任务结束 参考链接

  1. 利用nohup来运行要执行的程序,nohup可以在服务器后台一直运行提交的程序,即使是终端窗口突然关闭也不会终止程序,例如:

nohup python train.py &

  1. 查看任务是否还在运行

ps -aux | grep python

  1. 想要提前结束程序

kill -9 进程号


版权声明:本文为dandiaozhuyi原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。