如何解决TCP socket的阻塞问题
解决TCP socket的阻塞问题
大家知道,tcp的读和写是阻塞的,即读的时候不知道什么时候读完,写的时候不知道什么时候写完,因此线程就一直暂停在哪里,一般tcp程序用在上位机下位机之间对吧!
下位机一些设备一般会发心跳报文给我们机器,假设为10s发一次吧,当机器超过10s没接收到数据,那么我们就要考虑把socket断开,因为不断开的话设备重新连接可能又会建立新的socket,这样如果设备反复断开连接的话,将产生大量的socket,占用大量系统资源,这里我们用socket.setSoTimeout(500)方法解决read方法的阻塞问题,同时设定一个标志位
在异常处理程序当中退出socket连接
public void run(){
InputStream is = null;
OutputStream os = null;
int flag = 0;
try {
socket.setSoTimeout(500); // 0.5秒就退出read()方法的阻塞
is = socket.getInputStream();
os = socket.getOutputStream();
} catch (Exception e2) {
e2.printStackTrace();
}
while (true) {
try {
// 读取数据
int readlen = is.read(buff);
if (readlen > 0) {
flag = 0;
}
byte data[] = Arrays.copyOfRange(buff, 0, readlen);
resolveData(data);
} catch (IOException e) {
try {
flag++;
if (flag == 200) {
is.close();
os.close();
socket.close();
}
} catch (Exception e1) {
e1.printStackTrace();
}
}
}
}
TCP连接阻塞的监控和处理
那么,什么样的TCP连接属于上述发生阻塞的异常连接呢?结合线上运维经验
我们整理出符合该类异常的特征如下
- 该连接的Recv_Q的值特别大(超过3M)
- 该连接的Recv_Q的值持续上涨,造成堆积(在一定滑动时间窗口内)
- 服务端进程已长时间不再处理该连接的请求(超过90秒)
其中Recv_Q的值可以通过netstat或ss系统工具即可进行Recv_Q队列大小的采样,从而进行阀值判断。
netstat 的结果是读取/proc/net/tcp文件而来的.
如何查看一个连接的创建时间
1.nestat -apn | grep xxx查看到对应的连接的进程pid和端口
2. 将上下游端口,转换为16进制xxxa xxxb
3.然后cat /proc/net/tcp | grep -i xxxa | grep -i xxxb找到该socket连接的inode inodex
4.ls -al /proc/pid/fd | grep inodex即可看见该socket文件的创建时间.
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。
以上是 如何解决TCP socket的阻塞问题 的全部内容, 来源链接: utcz.com/p/251472.html