似乎正在等待的线程的CPU使用率高
我目前正在运行一些JMeter测试,以测试Web服务的性能。它使用了大量的CPU。对于一个JMeter请求线程,它的使用率在10%到30%之间(取决于请求的类型)。当我将其最多泵入15个线程时,我获得了约95%的CPU使用率。自然,我想弄清楚发生了什么。我做了一个Hprof
CPU示例(我尝试了times选项,但是花了一个半小时才开始我的服务,并且没有消息通过)。以下是该采样结果的摘要(跨15分钟)。
CPU SAMPLES BEGIN(总计= 220846)2014年8月22日星期五等级自累计数跟踪方法
1 14.96%14.96%33038 300514 java.net.PlainSocketImpl.socketAccept
2 14.84%29.80%32776 301258 sun.nio.ch.EPollArrayWrapper.epollWait
3 12.45%42.26%27505 313002 sun.nio.ch.EPollArrayWrapper.epollWait
4 7.48%49.73%16517 300604 java.net.PlainSocketImpl.socketAccept
5 7.18%56.91%15856 303203 sun.nio.ch.EPollArrayWrapper.epollWait
6 6.18%63.09%13639 313001 sun.nio.ch.ServerSocketChannelImpl.accept0
7 6.04%69.13%13329 304259 sun.nio.ch.Epoll.epoll等待
8 5.11%74.23%11275 307102 sun.nio.ch.EPollArrayWrapper.epollWait
以及那些顶级样本的对应堆栈:
跟踪300514: java.net.PlainSocketImpl.socketAccept(:未知行)
java.net.AbstractPlainSocketImpl.accept(:未知行)
java.net.ServerSocket.implAccept(:未知行)
java.net.ServerSocket.accept(:未知行)
sun.rmi.transport.tcp.TCPTransport $ AcceptLoop.executeAcceptLoop(:未知行)
sun.rmi.transport.tcp.TCPTransport $ AcceptLoop.run(:未知行)
java.lang.Thread.run(:未知行)
TRACE 301258:
sun.nio.ch.EPollArrayWrapper.epollWait(:未知行)
sun.nio.ch.EPollArrayWrapper.poll(:未知行)
sun.nio.ch.EPollSelectorImpl.doSelect(:未知行)
sun.nio.ch.SelectorImpl.lockAndDoSelect(:未知行)
sun.nio.ch.SelectorImpl.select(:未知行)
org.apache.tomcat.util.net.NioBlockingSelector $ BlockPoller.run(NioBlockingSelector.java:327)
TRACACE 313002:
sun.nio.ch.EPollArrayWrapper.epollWait(:未知行)
sun.nio.ch.EPollArrayWrapper.poll(:未知行)
sun.nio.ch.EPollSelectorImpl.doSelect(:未知行)
sun.nio.ch.SelectorImpl.lockAndDoSelect(:未知行)
sun.nio.ch.SelectorImpl.select(:未知行)
org.apache.tomcat.util.net.NioEndpoint $ Poller.run(NioEndpoint.java:1163)
java.lang.Thread.run(:未知行)
跟踪300604:
java.net.PlainSocketImpl.socketAccept(:未知行)
java.net.AbstractPlainSocketImpl.accept(:未知行)
java.net.ServerSocket.implAccept(:未知行)
java.net.ServerSocket.accept(:未知行)
sun.management.jmxremote.LocalRMIServerSocketFactory $ 1.accept(:未知行)
sun.rmi.transport.tcp.TCPTransport $ AcceptLoop.executeAcceptLoop(:未知行)
sun.rmi.transport.tcp.TCPTransport $ AcceptLoop.run(:未知行)
java.lang.Thread.run(:未知行)
TRACE 303203:
sun.nio.ch.EPollArrayWrapper.epollWait(:未知行)
sun.nio.ch.EPollArrayWrapper.poll(:未知行)
sun.nio.ch.EPollSelectorImpl.doSelect(:未知行)
sun.nio.ch.SelectorImpl.lockAndDoSelect(:未知行)
sun.nio.ch.SelectorImpl.select(:未知行)
net.spy.memcached.MemcachedConnection.handleIO(MemcachedConnection.java:217)
net.spy.memcached.MemcachedConnection.run(MemcachedConnection.java:836)
TRACE 313001:
sun.nio.ch.ServerSocketChannelImpl.accept0(:未知行)
sun.nio.ch.ServerSocketChannelImpl.accept(:未知行)
org.apache.tomcat.util.net.NioEndpoint $ Acceptor.run(NioEndpoint.java:793)
java.lang.Thread.run(:未知行)
TRACE 304259:
sun.nio.ch.EPoll.epollWait(:未知行)
sun.nio.ch.EPollPort $ EventHandlerTask.poll(:未知行)
sun.nio.ch.EPollPort $ EventHandlerTask.run(:未知行)
java.lang.Thread.run(:未知行)
TRACE 307102:
sun.nio.ch.EPollArrayWrapper.epollWait(:未知行)
sun.nio.ch.EPollArrayWrapper.poll(:未知行)
sun.nio.ch.EPollSelectorImpl.doSelect(:未知行)
sun.nio.ch.SelectorImpl.lockAndDoSelect(:未知行)
sun.nio.ch.SelectorImpl.select(:未知行)
net.spy.memcached.MemcachedConnection.handleIO(MemcachedConnection.java:217)
net.spy.memcached.MemcachedConnection.run(MemcachedConnection.java:836)
如您所见,超过一半的CPU使用率似乎来自应该等待的线程。那不应该占用CPU时间吗?
我看到了该线程http://www.brendangregg.com/blog/2014-06-09/java-cpu-sampling-using-
hprof.html,这可能使我认为此结果具有误导性,但我的“ top
-H”结果显示最大的CPU使用率,Zabbix监视也是如此。因此,看来它实际上是在消耗CPU。但是,这里有一个指向hprof作者的报价的链接,其中指出:
如果您有Java线程以某种方式不使用CPU,而是设法保持活动状态,那么看起来好像这些堆栈跟踪在不使用它们时正在消耗大量的CPU时间。
有人可以解释为什么会这样吗,在这些情况下我可以做些什么来减少CPU使用率?还是所有CPU使用率指标实际上都具有误导性?如果是这样,什么是了解我的服务中真实CPU利用率的更好方法?
回答:
正如Brendan
Gregg指出您链接的博客文章一样,JVM认为可运行的所有线程中的hprof示例。如您在Thread.state的Javadoc中所见,JVM区分以下线程状态:
- 新:尚未启动的线程处于此状态。
- 可运行:在Java虚拟机中执行的线程处于此状态。
- BLOCKED:处于等待监视器锁定状态的被阻塞线程处于此状态。
- 等待:无限期等待另一个线程执行特定操作的线程处于此状态。
- TIMED_WAITING:正在等待另一个线程执行操作的线程最多达到指定的等待时间,该线程处于此状态。
- 终止:退出的线程处于此状态。
如我们所见,JVM没有专用于等待I /
O的线程的状态。这是因为这样的线程实际上是由操作系统而不是JVM阻止的。也就是说,就JVM而言,等待网络适配器的线程是可运行的。实际上,用于RUNNABLE状态的详细Javadoc写道:
可运行线程的线程状态。处于可运行状态的线程正在Java虚拟机中执行,但它可能正在等待来自操作系统(例如处理器)的其他资源。
因此,在hprof“ cpu”采样中存在I / O方法并不表示这些方法消耗了CPU,因为它们的等待时间也被计算在内。
您可以:
- 假定I / O方法不导致CPU消耗,并着重于其他方法
- 使用更好的探查器,将等待操作系统级别的资源考虑在内
以上是 似乎正在等待的线程的CPU使用率高 的全部内容, 来源链接: utcz.com/qa/427403.html