Для тестирования мы будем использовать эту простую программу:
|
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
|
public class Main { public static void main(String[] args) { new Thread(new Idle(), 'Idle').start(); new Thread(new Busy(), 'Busy').start(); }}class Idle implements Runnable { @Override public void run() { try { TimeUnit.HOURS.sleep(1); } catch (InterruptedException e) { } }}class Busy implements Runnable { @Override public void run() { while(true) { 'Foo'.matches('F.*'); } }} |
Как видите, запускается два потока. Idle не потребляется никакой процессор (помните, что спящие потоки потребляют память, но не процессор), в то время как Busy съедает все ядро, поскольку анализ и выполнение регулярных выражений является удивительно сложным процессом. Давайте запустим эту программу и забудем об этом. Как мы можем быстро выяснить, что Busy является проблемной частью нашего программного обеспечения? Прежде всего мы используем top, чтобы узнать идентификатор процесса ( PID ) java процесса, который потребляет большую часть процессора. Это довольно просто:
|
1
|
$ top -n1 | grep -m1 java |
Это отобразит первую строку top вывода, содержащего предложение « java »:
|
1
|
22614 tomek 20 0 1360m 734m 31m S 6 24.3 7:36.59 java |
Первый столбец — это PID, давайте его извлечем. К сожалению, оказалось, что top использует управляющие коды ANSI для цветов — невидимых символов, которые ломают такие инструменты, как grep и cut . К счастью, я нашел Perl-скрипт для удаления этих символов и, наконец, смог извлечь PID процесса java исчерпав мой процессор:
|
1
|
$ top -n1 | grep -m1 java | perl -pe 's/\e\[?.*?[\@-~] ?//g' | cut -f1 -d' ' |
cut -f1 -d' ' просто берет первое значение из разделенных пробелами столбцов:
|
1
|
22614 |
Теперь, когда у нас есть проблемный PID JVM, мы можем использовать top -H чтобы найти проблемные потоки Linux. Опция -H выводит список всех потоков в отличие от процессов , столбец PID теперь представляет внутренний идентификатор потока Linux:
|
1
2
|
$ top -n1 -H | grep -m1 java$ top -n1 -H | grep -m1 java | perl -pe 's/\e\[?.*?[\@-~] ?//g' | cut -f1 -d' ' |
Выходные данные удивительно похожи, но первое значение теперь является идентификатором потока:
|
1
2
|
25938 tomek 20 0 1360m 748m 31m S 2 24.8 0:15.15 java25938 |
Таким образом, у нас есть идентификатор процесса нашей занятой JVM и идентификатор потока Linux (скорее всего, из этого процесса), потребляющий наш процессор. Самое интересное : если вы посмотрите на вывод jstack (доступный в JDK), рядом с именем каждого потока будет напечатан какой-то загадочный идентификатор:
|
1
2
3
|
'Busy' prio=10 tid=0x7f3bf800 nid=0x6552 runnable [0x7f25c000] java.lang.Thread.State: RUNNABLE at java.util.regex.Pattern$Node.study(Pattern.java:3010) |
Все верно, параметр nid=0x645a совпадает с идентификатором потока, напечатанным с помощью top -H . Конечно, чтобы не сделать это слишком простым, top использует десятичную запись, а jstack печатает в шестнадцатеричном виде. Опять есть простое решение, printf ‘% x’ :
|
1
2
|
$ printf '%x' 259386552 |
Давайте обернем все, что у нас есть, в скрипт и скомбинируем результаты:
|
1
2
3
4
|
#!/bin/bashPID=$(top -n1 | grep -m1 java | perl -pe 's/\e\[?.*?[\@-~] ?//g' | cut -f1 -d' ')NID=$(printf '%x' $(top -n1 -H | grep -m1 java | perl -pe 's/\e\[?.*?[\@-~] ?//g' | cut -f1 -d' '))jstack $PID | grep -A500 $NID | grep -m1 '^$' -B 500 |
PID содержит идентификатор java а NID — идентификатор потока, скорее всего, из этой JVM. Последняя строка просто сбрасывает трассировку стека JVM данного PID и отфильтровывает (используя grep ) поток, имеющий соответствующий nid . Угадайте, что это работает:
|
01
02
03
04
05
06
07
08
09
10
11
12
13
14
|
$ ./profile.sh'Busy' prio=10 tid=0x7f3bf800 nid=0x6552 runnable [0x7f25c000] java.lang.Thread.State: RUNNABLE at java.util.regex.Pattern$Node.study(Pattern.java:3010) at java.util.regex.Pattern$Curly.study(Pattern.java:3854) at java.util.regex.Pattern$CharProperty.study(Pattern.java:3355) at java.util.regex.Pattern$Start.<init>(Pattern.java:3044) at java.util.regex.Pattern.compile(Pattern.java:1480) at java.util.regex.Pattern.<init>(Pattern.java:1133) at java.util.regex.Pattern.compile(Pattern.java:823) at java.util.regex.Pattern.matches(Pattern.java:928) at java.lang.String.matches(String.java:2090) at com.blogspot.nurkiewicz.Busy.run(Main.java:27) at java.lang.Thread.run(Thread.java:662) |
Многократный запуск скрипта (или с помощью watch , см. Ниже) захватывает поток Busy в разных местах, но почти всегда внутри парсера регулярного выражения — что является нашей проблемной частью!
Несколько потоков
Если в вашем приложении есть несколько потоков, watch -n1 ./profile.sh процессором, вы можете использовать watch -n1 ./profile.sh чтобы запускать сценарий каждую секунду и получать полу-дампы стека в реальном времени, скорее всего, из разных потоков. Тестирование с помощью следующей программы:
|
1
2
3
|
new Thread(new Idle(), 'Idle').start();new Thread(new Busy(), 'Busy-1').start();new Thread(new Busy(), 'Busy-2').start(); |
вы увидите трассировку стека потоков Busy-1 или Busy-2 (в разных местах внутри класса Pattern ), но не в режиме Idle .
Ссылка: Какой поток Java потребляет мой процессор? от нашего партнера JCG Томаша Нуркевича в блоге о Java и соседстве .