讨论一种可靠的socket断线重连方法
做tcp客户端,有时网络问题掉线了,要快速检测到并且重新连接。目前的思路是用send和recv出错来判断掉线,然后关闭接收发送线程,关闭socket,重新创建socket来连接。但实际中发现掉线后重连会出现错误:Network is unreachable。查看/dev/下的设备,发现ttyUSB1和ttyUSB2都不见了(程序刚开始运行时是在的,ttyUSB2是3g通信模块设备)。不知道是什么问题。
各位有什么比较好的方法可以快速检测到断线并且重新连接吗,有遇到类似问题的吗,请指教一下。
检测到掉线后调用的连接线程函数:
void* TCP_CLIENT::connect_thread_fun(void* data)
{
TCP_CLIENT* parent = (TCP_CLIENT*)data;
// create a socket
if((parent->socket_handle = socket(AF_INET,SOCK_STREAM,0))== -1)
{
perror("连接服务器创建socket失败");
return NULL;
}
else
{
//set socket unblock
int x = fcntl(parent->socket_handle,F_GETFL,0);
fcntl(parent->socket_handle,F_SETFL,x|O_NONBLOCK);
}
//connect to the server
if(parent->connect_retry(parent->socket_handle,(struct sockaddr*)&parent->socket_addr,sizeof(parent->socket_addr)) == -1)
{
parent->disconnect_serv();
parent->trying_connect = false;
perror("服务器连接失败");
return NULL;
}
else
{
serv_connected = true;
parent->trying_connect = false;
cout<
pthread_create(&parent->send_thread,NULL,send_thread_fun,parent);
pthread_detach(parent->send_thread);
pthread_create(&parent->recv_thread,NULL,recv_thread_fun,parent);
pthread_detach(parent->recv_thread);
}
}
//APUE抄来的连接retry函数
int TCP_CLIENT::connect_retry(int sockfd, const struct sockaddr * srv_addr, socklen_t addrlen)
{
int nsec;
for(nsec = 1;nsec
{
if(connect(sockfd,srv_addr,addrlen) == 0)
return 0;
if(nsec <= MAXSLEEP/2)
sleep(nsec);
}
return -1;
}
bool TCP_CLIENT::disconnect_serv()
{
if(socket_handle != -1)
{
close(socket_handle);
socket_handle = -1;
}
serv_connected = false;
return true;
}
------解决方案--------------------
通常判断断线是通过心跳包,或者多长时间之内没有收到数据超时,来判断断线重连
send和recv出错不一定是断线导致的
------解决方案--------------------
通过心跳包+时间戳来判断是否超时

------解决方案--------------------
不要动态创建、销毁线程。要使用线程池。
重连操作要避免重入,要适当间隔一段时间比如10秒。