可能同学经常会遇到生产环境下的某台跑Java的服务器,在刚发布时的时候一切都很正常,在运行一段时间后就出现CPU占用很高或负载飙高等现象,好一点的负载或CPU一天比一天高,差的情况,就是随机进行抖动,后又恢复正常,给运维及开发同学带来了不少困扰。当然,出现此问题时,后续要如何改进,诸如:代码上线前要进行review、相关强弱依赖服务隔离/降级等、单元测试、回归测试、SQL上线审核、基础及业务监控、相关流程制度等。
我们提供的服务有:网站设计、网站建设、微信公众号开发、网站优化、网站认证、娄烦ssl等。为成百上千家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务,是有科学管理、有技术的娄烦网站制作公司若CPU使用率或负载飙高,且持续时间较长,网上也有大量的排查步骤
方法一
1.使用top定位占用CPU高的进程PID
top
2.获取线程信息
ps -mp PID -o THREAD,tid,time | sort -rn
3.将需要的线程ID转换为16进制格式
printf "%x\n" tid
4.打印线程的堆栈信息
jstack pid |grep tid #这里的tid就是步骤3生成的 十六进制格式的tid
方法二(推荐)
可快速定位thread及thread的cpu使用率
#!/bin/bash # @Function # Find out the most cpu consumed threads of java,and print the stack trace of these threads. # # @Usage # $./javacpu -h # PROG=`basename $0` usage(){ cat <方法三(针对Java服务器的load负载随机抖动情况)
#!/usr/bin/env python import os import time, datetime import threading # desc: when system loadavg 1 min load lt 10,then dump java jstack def load_stat(): loadavg = {} f = open("/proc/loadavg") info = f.read().split() f.close() loadavg['lavg_1'] = info[0] loadavg['lavg_5']= info[1] loadavg['lavg_15']= info[2] start_time = datetime.datetime.strptime(str(datetime.datetime.now().date()) + '00:00', '%Y-%m-%d%H:%M') curr_time = datetime.datetime.now() end_time = datetime.datetime.strptime(str(datetime.datetime.now().date() + datetime.timedelta(days=2)) + '23:59', '%Y-%m-%d%H:%M') if (start_time <= curr_time <= end_time ) : if float(loadavg['lavg_1']) >= 11: pid = os.popen("jps |grep -v Jps|awk '{print $1}'").read() cmd = "jstack" + " " + pid stack = os.popen(cmd).read() tm = time.strftime("%Y-%m-%d_%H-%M-%S", time.localtime()) timeslog = 'java_stack_' + tm + r'.txt' log_f = open(timeslog, 'w') log_f.write(stack) log_f.close() cmd_2="ps -mp " + pid.strip('\n') + " -o THREAD,tid,time | sort -rn" top_tid_info=os.popen(cmd_2).read() cpu_tid_logs='tid_cpu_' + tm + r'.txt' log_f2 = open(cpu_tid_logs,'w') log_f2.write(top_tid_info) log_f2.close() threading.Timer(5, load_stat).start() else: threading.Timer(5, load_stat).start() else: exit #return loadavg load_stat()另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
本文标题:Java进程将CPU或负载拉高及快速定位脚本-创新互联
转载来源:http://lswzjz.com/article/disjeo.html