在TCP网络编程模型中,无论是客户端还是服务端,在网络编程的过程中都需要判断连接的对方网络状态是否正常。在linux系统中,有很多种方式可以判断连接的对方网络是否已经断开。
- 通过错误码和信号判断
- 通过select系统函数判断
- 通过TCP_INFO套接字选项判断
- 通过SO_KEEPALIVE套接字选项判断
- 通过SO_RCVTIMEO/SO_SNDTIMEO判断
(一)通过错误码和信号判断
(1)写数据信号和错误码判断
在写TCP连接数据的时候,如果对方连接已经正常断开,那么写数据端将会收到一个SIGPIPE信号,可以通过这个信号知道对方连接已经断开。该信号信号会终止当前进程,如果不在对方连接断开不退出进程,那么就应该注册信号函数。
同时,如果对方连接已经正常断开,那么write写数据端将会返回写错误。返回的写长度为-1,此时的错误码为:32,对应错误值为EPIPE;因此可以写数据时write的返回值和错误码来判断对方连接是否已经断开了。
(2)读数据判断返回值
如果当前是默认的阻塞模式读取,那么此时read读取返回的长度为0,错误码也是为0,其实表示读取成功。这里需要注意read 和recv接口的默认返回值是不一样的,使用recv接口也会返回EPIPE错误码。
client_tcp.c
-
/************************************************************
-
*Copyright (C),lcb0281at163.com lcb0281atgmail.com
-
*FileName: 01_client_tcp.c
-
*BlogAddr: caibiao-lee.blog.csdn.net
-
*Description: TCP 客户端收发数据
-
*Date: 2020-01-04
-
*Author: Caibiao Lee
-
*Version: V1.0
-
*Others:
-
通过read write 函数的返回值和错误码判断对方连接是否已经断开
-
*History:
-
***********************************************************/
-
#include <sys/uio.h>
-
#include <string.h>
-
#include <stdlib.h>
-
#include <stdio.h>
-
#include <stdlib.h>
-
#include <strings.h>
-
#include <sys/types.h>
-
#include <sys/socket.h>
-
#include <unistd.h>
-
#include <arpa/inet.h>
-
#include <signal.h>
-
#include <errno.h>
-
#include <netinet/ip.h>
-
#include <netinet/tcp.h>
-
-
#define SERVER_IP_ADDR "192.168.1.111"
-
#define PORT 8888 /* 侦听端口地址 */
-
-
void sig_proccess(int signo)
-
{
-
printf(
"Catch a exit signal\n");
-
exit(
0);
-
}
-
-
void sig_pipe(int sign)
-
{
-
printf(
"Catch a SIGPIPE signal\n");
-
-
/* 释放资源 */
-
}
-
-
-
void process_conn_client(int s32SocketFd)
-
{
-
int size =
0;
-
char buffer[
1024] = {
0};
-
char *sendData =
"I am client";
-
-
for(;;)
-
{
-
size = write(s32SocketFd, sendData,
strlen(sendData)+
1);
-
if(size!=
strlen(sendData)+
1)
-
{
-
printf(
"write data error size=%d errno=%d \n",size,errno);
-
//return ;
-
}
-
-
size = read(s32SocketFd, buffer,
1024);
-
if(size<=
0)
-
{
-
printf(
"read data error size=%d errno=%d \n",size,errno);
-
//return ;
-
}
else
-
{
-
printf(
"recv Data: %s\n",buffer);
-
}
-
sleep(
1);
-
-
}
-
}
-
-
int main(int argc, char *argv[])
-
{
-
-
struct sockaddr_in server_addr;
-
int l_s32SocketFd =
0;
-
-
-
signal(SIGINT, sig_proccess);
-
signal(SIGPIPE, sig_pipe);
-
-
/* 建立一个流式套接字 */
-
l_s32SocketFd = socket(AF_INET, SOCK_STREAM,
0);
-
if(l_s32SocketFd <
0)
-
{
/* 出错 */
-
printf(
"socket error\n");
-
return
-1;
-
}
-
-
/* 设置服务器地址 */
-
bzero(&server_addr,
sizeof(server_addr));
/* 清0 */
-
server_addr.sin_family = AF_INET;
/* 协议族 */
-
server_addr.sin_addr.s_addr = inet_addr(SERVER_IP_ADDR);
/*服务器IP地址*/
/* 本地地址 */
-
server_addr.sin_port = htons(PORT);
/* 服务器端口 */
-
-
/* 连接服务器 */
-
connect(l_s32SocketFd, (struct sockaddr*)&server_addr,
sizeof(struct sockaddr));
-
process_conn_client(l_s32SocketFd);
/* 客户端处理过程 */
-
-
close(l_s32SocketFd);
/* 关闭连接 */
-
-
return
0;
-
}
-
server_tcp.c
-
/************************************************************
-
*Copyright (C),lcb0281at163.com lcb0281atgmail.com
-
*FileName: 01_server_tcp.c
-
*BlogAddr: caibiao-lee.blog.csdn.net
-
*Description: TCP 客户端收发数据
-
*Date: 2020-01-04
-
*Author: Caibiao Lee
-
*Version: V1.0
-
*Others:
-
通过read write 函数的返回值和错误码判断对方连接是否已经断开
-
*History:
-
***********************************************************/
-
#include <sys/uio.h>
-
#include <string.h>
-
#include <stdlib.h>
-
#include <stdio.h>
-
#include <stdlib.h>
-
#include <strings.h>
-
#include <sys/types.h>
-
#include <sys/socket.h>
-
#include <unistd.h>
-
#include <arpa/inet.h>
-
#include <signal.h>
-
#include <errno.h>
-
#include <netinet/ip.h>
-
#include <netinet/tcp.h>
-
-
#define SERVER_IP_ADDR "192.168.1.111"
-
#define PORT 8888 /* 侦听端口地址 */
-
#define BACKLOG 2 /* 侦听队列长度 */
-
-
void sig_proccess(int signo)
-
{
-
printf(
"Catch a exit signal\n");
-
exit(
0);
-
}
-
-
void sig_pipe(int sign)
-
{
-
printf(
"Catch a SIGPIPE signal\n");
-
-
/* 释放资源 */
-
}
-
-
/* 服务器对客户端的处理 */
-
void process_conn_server(int s32SocketFd)
-
{
-
int size =
0;
-
char buffer[
1024];
/* 数据的缓冲区 */
-
-
for(;;)
-
{
-
/* 从套接字中读取数据放到缓冲区buffer中 */
-
size = read(s32SocketFd, buffer,
1024);
-
if(size==
0)
-
{
/* 没有数据 */
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return;
-
}
else
if(size<
0)
-
{
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return ;
-
}
else
-
{
-
printf(
"recv data:%s \n",buffer);
-
-
}
-
memset(buffer,
0,
sizeof(buffer));
-
/* 构建响应字符,为接收到客户端字节的数量 */
-
strcpy(buffer,
"I am server");
-
size = write(s32SocketFd, buffer,
strlen(buffer)+
1);
/* 发给客户端 */
-
if((
strlen(buffer)+
1)==size)
-
{
-
-
}
else
-
{
-
printf(
"write data error size = %d, errno=%d\n",size,errno);
-
//return ;
-
}
-
sleep(
1);
-
}
-
}
-
-
int main(int argc, char *argv[])
-
{
-
int l_s32ServerFd =
-1;
-
int l_s32ClientrFd =
-1;
-
struct sockaddr_in server_addr;
/* 服务器地址结构 */
-
struct sockaddr_in client_addr;
/* 客户端地址结构 */
-
int l_s32Ret =
0;
/* 返回值 */
-
pid_t pid;
/* 分叉的进行id */
-
-
signal(SIGINT, sig_proccess);
-
signal(SIGPIPE, sig_pipe);
-
-
-
/* 建立一个流式套接字 */
-
l_s32ServerFd = socket(AF_INET, SOCK_STREAM,
0);
-
if(l_s32ServerFd <
0)
-
{
/* 出错 */
-
printf(
"socket error\n");
-
return
-1;
-
}
-
-
/* 设置服务器地址 */
-
bzero(&server_addr,
sizeof(server_addr));
/* 清0 */
-
server_addr.sin_family = AF_INET;
/* 协议族 */
-
server_addr.sin_addr.s_addr = inet_addr(SERVER_IP_ADDR);
/*服务器IP地址*/
-
server_addr.sin_port = htons(PORT);
/* 服务器端口 */
-
-
-
/*设置IP地址可以重复绑定*/
-
int l_s32UseAddr =
1;
-
if(setsockopt(l_s32ServerFd, SOL_SOCKET, SO_REUSEADDR, &l_s32UseAddr,
sizeof(
int)) <
0)
-
{
-
printf(
"%s %d\tsetsockopt error! Error code: %d,Error message: %s\n",
-
__FUNCTION__, __LINE__, errno, strerror(errno));
-
return
-2;
-
}
-
-
/* 绑定地址结构到套接字描述符 */
-
l_s32Ret = bind(l_s32ServerFd, (struct sockaddr*)&server_addr,
sizeof(server_addr));
-
if(l_s32Ret <
0)
-
{
/* 出错 */
-
printf(
"bind error\n");
-
return
-1;
-
}
-
-
/* 设置侦听 */
-
l_s32Ret = listen(l_s32ServerFd, BACKLOG);
-
if(l_s32Ret <
0)
-
{
/* 出错 */
-
printf(
"listen error\n");
-
return
-1;
-
}
-
-
/* 主循环过程 */
-
for(;;)
-
{
-
int addrlen =
sizeof(struct sockaddr);
-
/* 接收客户端连接 */
-
l_s32ClientrFd = accept(l_s32ServerFd, (struct sockaddr*)&client_addr, &addrlen);
-
if(l_s32ClientrFd <
0)
-
{
/* 出错 */
-
continue;
/* 结束本次循环 */
-
}
-
-
/* 建立一个新的进程处理到来的连接 */
-
pid = fork();
/* 分叉进程 */
-
if( pid ==
0 )
-
{
/* 子进程中 */
-
close(l_s32ServerFd);
/* 在子进程中关闭服务器的侦听 */
-
process_conn_server(l_s32ClientrFd);
/* 处理连接 */
-
}
else
-
{
-
close(l_s32ClientrFd);
/* 在父进程中关闭客户端的连接 */
-
}
-
}
-
}
-
(二)通过select系统函数判断
select实际是IO复用的一个接口,它可以同时检测多个连接是否有数据可读写操作,并且可以设置检测的超时时间。
在点对点的连接中如果select超时,它返回值为0;
- 当出现异常的时候,返回-1,如果对方断开可能收到104的错误码,也就是ECONNRESET,表示连接被重置
- 当select返回1,表示正常,如果read此时返回的值为0,表示对方连接已经断开。
-
/********************************************************
-
Function: process_conn_server
-
Description: 服务器对客户端的处理
-
Input: s32SocketFd :服务端接收到客户端连接的ID;
-
OutPut: none
-
Return: 0: success,none 0:error
-
Others: 通过select判断客户端的连接状态
-
Author: Caibiao Lee
-
Date: 2020-01-04
-
*********************************************************/
-
void process_conn_server(int s32SocketFd)
-
{
-
int size =
0;
-
int l_s32Ret =
0;
-
char buffer[
1024];
/* 数据的缓冲区 */
-
fd_set l_stReadfd;
-
struct timeval l_stTimeout={
0};
-
-
for(;;)
-
{
-
l_stTimeout.tv_sec=
0;
-
l_stTimeout.tv_usec=
10000;
-
FD_ZERO(&l_stReadfd);
-
FD_SET(s32SocketFd ,&l_stReadfd);
-
l_s32Ret = select(s32SocketFd+
1, &l_stReadfd,
NULL,
NULL, &l_stTimeout);
-
if (l_s32Ret<=
0)
-
{
-
printf(
"select error l_s32Ret=%d errno=%d\n",l_s32Ret,errno);
-
usleep(
100000);
-
}
-
else
if(FD_ISSET(s32SocketFd,&l_stReadfd))
-
{
-
printf(
"l_s32Ret = %d \n",l_s32Ret);
-
/* 从套接字中读取数据放到缓冲区buffer中 */
-
size = read(s32SocketFd, buffer,
1024);
-
if(size==
0)
-
{
/* 没有数据 */
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return;
-
}
else
if(size<
0)
-
{
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return ;
-
}
else
-
{
-
printf(
"recv data:%s \n",buffer);
-
}
-
}
-
-
memset(buffer,
0,
sizeof(buffer));
-
/* 构建响应字符,为接收到客户端字节的数量 */
-
strcpy(buffer,
"I am server");
-
size = write(s32SocketFd, buffer,
strlen(buffer)+
1);
/* 发给客户端 */
-
if((
strlen(buffer)+
1)==size)
-
{
-
-
}
else
-
{
-
printf(
"write data error size = %d, errno=%d\n",size,errno);
-
//return ;
-
}
-
sleep(
1);
-
}
-
}
(三)通过TCP_INFO套接字选项判断
通过getsockopt函数可以获取TCP连接的连接状态,当状态为ESTABLISHED的时候表示该连接正常。TCP的其它状态还有:
- CLOSED:表示初始状态。对服务端和C客户端双方都一样。
- LISTEN:表示监听状态。服务端调用了listen函数,可以开始accept连接了。
- SYN_SENT:表示客户端已经发送了SYN报文。当客户端调用connect函数发起连接时,首先发SYN给服务端,然后自己进入SYN_SENT状态,并等待服务端发送ACK+SYN。
- SYN_RCVD:表示服务端收到客户端发送SYN报文。服务端收到这个报文后,进入SYN_RCVD状态,然后发送ACK+SYN给客户端。
- ESTABLISHED:表示连接已经建立成功了。服务端发送完ACK+SYN后进入该状态,客户端收到ACK后也进入该状态。
- FIN_WAIT_1:表示主动关闭连接。无论哪方调用close函数发送FIN报文都会进入这个这个状态。
- FIN_WAIT_2:表示被动关闭方同意关闭连接。主动关闭连接方收到被动关闭方返回的ACK后,会进入该状态。
- TIME_WAIT:表示收到对方的FIN报文并发送了ACK报文,就等2MSL后即可回到CLOSED状态了。如果FIN_WAIT_1状态下,收到对方同时带FIN标志和ACK标志的报文时,可以直接进入TIME_WAIT状态,而无须经过FIN_WAIT_2状态。
- CLOSING:表示双方同时关闭连接。如果双方几乎同时调用close函数,那么会出现双方同时发送FIN报文的情况,此时就会出现CLOSING状态,表示双方都在关闭连接。
- CLOSE_WAIT:表示被动关闭方等待关闭。当收到对方调用close函数发送的FIN报文时,回应对方ACK报文,此时进入CLOSE_WAIT状态。
- LAST_ACK:表示被动关闭方发送FIN报文后,等待对方的ACK报文状态,当收到ACK后进入CLOSED状态。
功能代码如下:
-
/********************************************************
-
Function: check_tcp_alive
-
Description: 通过TCP_INFO查询网络状态
-
Input: s32SocketFd :服务端接收到客户端连接的ID;
-
OutPut: none
-
Return: 0: success,none 0:error
-
Others:
-
Author: Caibiao Lee
-
Date: 2020-01-04
-
*********************************************************/
-
int check_tcp_alive(int s32SocketFd)
-
{
-
while(
1)
-
{
-
printf(
"alive s32SocketFd = %d \n",s32SocketFd);
-
if(s32SocketFd>
0)
-
{
-
struct tcp_info info;
-
int len =
sizeof(info);
-
-
getsockopt(s32SocketFd, IPPROTO_TCP, TCP_INFO, &info, (
socklen_t *)&len);
-
-
printf(
"info.tcpi_state = %d\n",info.tcpi_state);
-
if(info.tcpi_state == TCP_ESTABLISHED)
-
{
-
printf(
"connect ok \r\n");
-
//return 0;
-
}
-
else
-
{
-
printf(
"connect error\r\n");
-
//return -1;
-
}
-
}
-
sleep(
1);
-
printf(
"\n\n");
-
}
-
}
(四)通过SO_KEEPALIVE套接字选项判断
选项SO_KEEPALIVE用于设置TCP连接的保持,当设置此项后,连接会测试连接的状态。这个选项用于可能长时间没有数据交流的连接,通常在服务器端进行设置。
当设置SO_KEEPALIVE选项后,如果在两个小时内没有数据通信时,TCP会自动发送一个活动探测数据报文,对方必须对此进行响应,通常有如下3种情况。
- TCP的连接正常,发送一个ACK响应,这个过程应用层是不知道的。再过两个小时,又会再发送一个。
- 对方发送RST响应,对方在2个小时内进行了重启或者崩溃。之前的连接己经失效,套接字收到一个ECONNRESET错误,之前的套接字关闭。
- 如果对方没有任何响应,则本机会发送另外8个活动探测报文,时间的间隔为75s,当第一个活动报文发送11分15秒后仍然没有收到对方的任何响应,则放弃探测,套接字错误类型设置为ETIMEOUT,并关闭套接字连接。如果收到一个ICMP控制报文响应,此时套接字也关闭,这种情况通常收到的是一个主机不可达的ICMP报文,此时套接字错误类型设置为EHOSTUNREACH,并关闭套接字连接。
SO_KEEPALIVE的使用场景主要是在可能发送长时间无数据响应的TCP连接,例如Telnet会话,经常会出现打开一个telnet客户端后,长时间不用的情况,这需要服务器或 者客户端有一个探测机制知道对方是否仍然活动。根据探测结果服务器会释放己经失效的客户端,保证服务器资源的有效性,例如有的telnet客户端没有按照正常步骤进行关闭。
网上有不少资料介绍不推荐使用SO_KEEPALIVE来判断网络连接是否断开,具体原因没有去追踪,这里不再介绍它的使用。
(五)通过SO_RCVTIMEO/SO_SNDTIMEO判断
这个是通过套接字的SO_RCVTIMEO、SO_SNDTIMEO来设置收发数据超时。对于前面的前面的几种判断方式,都是基于对方正常网络断开后,主机才能够正常的判断到网络状态。如果连接的某一方突然断电,主机并不能知道对方设备突然断电,通过TCP_INFO查询到的也是网络正常,但实际情况是这是网络连接已经断开了。
这时,可以使用收发数据超时来判断:
如果设置的时间没有收到数据,read时会返回-1,同时有错误码EAGAIN产生,这时是可以判断出对连接已经断开了。
这种方式的确定就是,如果设定的一段时间没有收发数据,就会被判断为超时断开连接。
-
/********************************************************
-
Function: process_conn_server
-
Description: 通过设置收发操作判断对方连接已经断开了
-
Input: s32SocketFd :服务端接收到客户端连接的ID;
-
OutPut: none
-
Return: 0: success,none 0:error
-
Others:
-
Author: Caibiao Lee
-
Date: 2020-01-04
-
*********************************************************/
-
void process_conn_server(int s32SocketFd)
-
{
-
int size =
0;
-
char buffer[
1024];
/* 数据的缓冲区 */
-
int optlen =
-1;
/* 整型的选项类型值 */
-
int l_s32Ret =
0;
-
-
/* 设置发送和接收超时时间 */
-
struct timeval tv;
-
tv.tv_sec =
10;
/* 1秒 */
-
tv.tv_usec =
200000;
/* 200ms */
-
optlen =
sizeof(tv);
-
l_s32Ret = setsockopt(s32SocketFd, SOL_SOCKET, SO_RCVTIMEO, &tv, optlen);
/* 设置接收超时时间 */
-
if(l_s32Ret ==
-1){
/* 设置接收超时时间失败 */
-
printf(
"设置接收超时时间失败\n");
-
}
-
-
l_s32Ret = setsockopt(s32SocketFd, SOL_SOCKET, SO_SNDTIMEO, &tv, optlen);
/* 设置发送超时时间 */
-
if(l_s32Ret ==
-1){
-
printf(
"设置发送超时时间失败\n");
-
}
-
-
for(;;)
-
{
-
/* 从套接字中读取数据放到缓冲区buffer中 */
-
size = read(s32SocketFd, buffer,
1024);
-
if(size==
0)
-
{
/* 没有数据 */
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return;
-
}
else
if(size<
0)
-
{
-
printf(
"read size = %d, error %d \n",size,errno);
-
//return ;
-
}
else
-
{
-
printf(
"recv data:%s \n",buffer);
-
-
}
-
memset(buffer,
0,
sizeof(buffer));
-
/* 构建响应字符,为接收到客户端字节的数量 */
-
strcpy(buffer,
"I am server");
-
size = write(s32SocketFd, buffer,
strlen(buffer)+
1);
/* 发给客户端 */
-
if((
strlen(buffer)+
1)==size)
-
{
-
-
}
else
-
{
-
printf(
"write data error size = %d, errno=%d\n",size,errno);
-
//return ;
-
}
-
sleep(
1);
-
}
-
}
(六)自定义通信心跳判断
在一些比较重要的命令收发链接中,一般是客户端和服务端会建立心跳机制,心跳时间间隔根据不同的业务需求而不同。当约定的时间段内没有收到心跳数据包,就可以判断对方是否已经断开了连接。
这种方式非常简单,对于嵌入式设备而言,主要的缺点是心跳会耗费流量,同时会增加一点点系统负载,并且不适合并发连接的情况。
以上就是现在比较常用的判断网络连接的方法。 如有错误,欢迎指出!
转载:https://blog.csdn.net/li_wen01/article/details/103923339