Netty百万连接场景下性能调优教程

1.1 模拟Netty单机连接瓶颈

我们知道,通常启动一个服务端会绑定一个端口例如8000端口当然客户端连接端口是有限制的,除去最大端口65535和默认的1024及以下的端口,就只剩下1024 65535个,再扣除一些常用端口,实际可用端口只有6万个左右。那么,我们如何实现单机百万连接呢?

假设在服务端启动[8000,8100)这100个端口,100 6万就可以实现600万个左右的连接,这是TCP的一个基础知识,虽然对于客户端来说是同一个端口号,但是对于服务端来说是不同的端口号,由于TCP是一个私源组概念,也就是说它是由源IP地址、源端口号、目的IP地址和目的端口号确定的,当源IP地址和源端口号是一样的,但是目的端口号不一样,那么最终系统底层会把它当作两条TCP连接来处理,所以这里取巧给服务端开启了100个端口号,这就是单机百万连接的准备工作,如下图所示。

单机1024及以下的端口只能给ROOT保留使用,客户端端口范围为1025 65535,接下来用代码实现单机百万连接的模拟场景。先看服务端类,循环开启[8000,8100)这100个监听端口,等待客户端连接,代码如下。

然后看ConnectionCountHandler类的实现逻辑,主要用来统计单位时间内的请求数,每接入一个连接则自增一个数字,每2s统计一次,代码如下。

再看客户端类代码,主要功能是循环依次往服务端开启的100个端口发起请求,直到服务端无响应、线程挂起为止,代码如下。

最后,将服务端程序打包发布到Linux服务器上,同样将客户端程序打包发布到另一台Linux服务器上。接下来分别启动服务端和客户端程序。运行一段时间之后,会发现服务端监听的连接数定格在一个值不再变化,如下所示。

并且抛出如下异常。

这个时候,我们就应该要知道,这已经是服务器所能接受客户端连接数量的瓶颈值,也就是服务端最大支持870个连接。接下来要做的事情是想办法突破这个瓶颈,让单台服务器也能支持100万个连接,这是一件多么激动人心的事情。

1.2 单机百万连接调优解决思路

1.2.1 突破局部文件句柄限制

首先在服务端输入命令,看一下单个进程所能支持的最大句柄数。

输入命令后,会出现1024的数字,表示Linux系统中一个进程能够打开的最大文件数,由于开启一个TCP连接就会在Linux系统中对应创建一个文件,所以就是受这个文件的最大文件数限制。那为什么前面演示的服务端连接数最终定格在870,比1024小呢?其实是因为除了连接数,还有JVM打开的文件Class类也算作进程内打开的文件,所以,1024减去JVM打开的文件数剩下的就是TCP所能支持的连接数。

接下来想办法突破这个限制,首先在服务器命令行输入以下命令,打开/etc/security/limits.conf文件。

然后在这个文件末尾加上下面两行代码。

前面的*表示当前用户,hard和soft分别表示限制和警告限制,nofile表示最大的文件数标识,后面的数字1000000表示任何用户都能打开100万个文件,这也是操作系统所能支持的最大值,如下图所示。

接下来,输入以下命令。

这时候,我们发现还是1024,没变,重启服务器。将服务端程序和客户端程序分别重新运行,这时候只需静静地观察连接数的变化,最终连接数停留在137920,同时抛出了异常,如下所示。

这又是为什么呢?肯定还有地方限制了连接数,想要突破这个限制,就需要突破全局文件句柄数的限制。

1.2.2 突破全局文件句柄限制

首先在Linux命令行输入以下命令,可以查看Linux系统所有用户进程所能打开的文件数。

通过上面这个命令可以看到全局的限制,发现得到的结果是10000。可想而知,局部文件句柄数不能大于全局的文件句柄数。所以,必须将全局的文件句柄数限制调大,突破这个限制。首先切换为ROOT用户,不然没有权限。

我们改成20000来测试一下,继续试验。分别启动服务端程序和客户端程序,发现连接数已经超出了20000的限制。

前面使用echo来配置/proc/sys/fs/file-max的话,重启服务器就会失效,还会变回原来的10000,因此,直接用vi命令修改,输入以下命令行。

在/etc/sysctl.conf文件末尾加上下面的内容。

结果如下图所示。

接下来重启Linux服务器,再启动服务端程序和客户端程序。

最终连接数定格在98万左右。我们发现主要受限于本机本身的性能。用htop命令查看一下,发现CPU都接近100%,如下图所示。

以上是操作系统层面的调优和性能提升,下面主要介绍基于Netty应用层面的调优。

1.3 Netty应用级别的性能调优

1.3.1 Netty应用级别的性能瓶颈复现

首先来看一下应用场景,下面是一段标准的服务端应用程序代码。

我们重点关注服务端的逻辑处理ServerHandler类。

上面代码中有一个getResult()方法。可以把getResult()方法看作是在数据库中查询数据的一个方法,把每次查询的结果返回给客户端。实际上,为了模拟查询数据性能,getResult()传入的参数是由客户端传过来的时间戳,最终返回的还是客户端传过来的值。只不过返回之前做了一次随机的线程休眠处理,以模拟真实的业务处理性能。如下表所示是模拟场景的性能参数。

下面来看客户端,也是一段标准的代码。

从上面代码中看到,客户端会向服务端发起1000次请求。重点来看客户端逻辑处理ClientHandler类。

上面代码主要模拟了Netty真实业务环境下的处理耗时情况,QPS大概在1000次,每2s统计一次。接下来,启动服务端和客户端查看控制台日志。首先运行服务端,看到控制台日志如下图所示。

然后运行客户端,看到控制台日志如下图所示,一段时间之后,发现QPS保持在1000次以内,平均响应时间越来越长。

回到服务端ServerHander的getResul()方法,在getResult()方法中有线程休眠导致阻塞,不难发现,它最终会阻塞主线程,导致所有的请求挤压在一个线程中。如果把下面的代码放入线程池中,效果将完全不同。

把这两行代码放到业务线程池里,不断在后台运行,运行完成后即时返回结果。

1.3.2 Netty应用级别的性能调优方案

下面来改造一下代码,在服务端的代码中新建一个ServerThreadPoolHander类。

然后在服务端的Handler处理注册为ServerThreadPoolHander,删除原来的ServerHandler,代码如下。

随后,启动服务端和客户端程序,查看控制台日志,如下图所示。

最终耗时稳定在1ms左右,QPS也超过了1000次。实际上这个结果还不是最优的状态,继续调整。将ServerThreadPoolHander的线程个数调整到20,代码如下。

然后启动程序,发现平均响应时间相差也不是太多,如下图所示。

由此得出的结论是:具体的线程数需要在真实的环境下不断地调整、测试,才能确定最合适的数值。本章旨在告诉大家优化的方法,而不是结果。

展开阅读全文

页面更新:2024-04-01

标签:句柄   线程   端口   服务端   客户端   场景   命令   性能   代码   发现   文件   程序   教程

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号

Top