最近定位一個服務(wù)問題時發(fā)現(xiàn)telnet某個端口,無法鏈接。無奈之下只能一步步排查。
10多年的阜康網(wǎng)站建設(shè)經(jīng)驗(yàn),針對設(shè)計、前端、開發(fā)、售后、文案、推廣等六對一服務(wù),響應(yīng)快,48小時及時工作處理。全網(wǎng)整合營銷推廣的優(yōu)勢是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動調(diào)整阜康建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計,從而大程度地提升瀏覽體驗(yàn)。成都創(chuàng)新互聯(lián)從事“阜康網(wǎng)站設(shè)計”,“阜康網(wǎng)站推廣”以來,每個客戶項目都認(rèn)真落實(shí)執(zhí)行。
端口是否存在
ss -l|grep LISTEN|grep 9999
如果端口存在那么可以觀察該端口上的recv-q send-q 如果是發(fā)生死鎖一般情況下這兩個隊列只會增加(當(dāng)然當(dāng)服務(wù)處理過慢時也會導(dǎo)致包堆積)
Recv-Q Send-Q Local Address:Port Peer Address:Port
0 1024 *:5200 *:*
ss |awk 'BEGIN{arr[""]=0}{arr[$1]++}END{for(i in arr) print i,arr[i]}'
LAST-ACK 1305
ESTAB 341643
State 1
FIN-WAIT-1 7553
CLOSING 3
FIN-WAIT-2 908
CLOSE-WAIT 60067
如果你的服務(wù)是多個進(jìn)程那么,如果只是一個進(jìn)程死鎖,那么很容易就可以看出來該進(jìn)程的cpu消耗時間應(yīng)該小于其他進(jìn)程,當(dāng)然這個取決于進(jìn)程的運(yùn)行時間。下面的進(jìn)程中,id=1903的進(jìn)程就是疑似死鎖問題。
root 1901 1 0 11:09 ? 00:00:00 ./client -f ../conf/client.ini -d
root 1902 1901 15 11:09 ? 00:31:55 ./client -f ../conf/client.ini -d
root 1903 1901 1 11:09 ? 00:02:25 ./client -f ../conf/client.ini -d
root 1904 1901 15 11:09 ? 00:31:19 ./client -f ../conf/client.ini -d
root 1905 1901 15 11:09 ? 00:31:17 ./client -f ../conf/client.ini -d
定位哪里死鎖
經(jīng)過一步步盤查之后,懷疑進(jìn)程死鎖,ok。最好的定位方法就是attach到進(jìn)程,然后bt一下既可以看到進(jìn)程hang在哪里。。。
$gdb attach 1903
#0 0x00007f105892105e in __lll_lock_wait_private () from /lib64/libc.so.6
#1 0x00007f10588c6cad in _L_lock_2164 () from /lib64/libc.so.6
#2 0x00007f10588c6a67 in __tz_convert () from /lib64/libc.so.6
#3 0x00007f105890da5d in __vsyslog_chk () from /lib64/libc.so.6
#4 0x00007f105889948e in __libc_message () from /lib64/libc.so.6
#5 0x00007f105889ee66 in malloc_printerr () from /lib64/libc.so.6
#6 0x00007f10588c6909 in tzset_internal () from /lib64/libc.so.6
#7 0x00007f10588c6a89 in __tz_convert () from /lib64/libc.so.6
#8 0x00000000004c0917 in shift_fd (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:95
#9 write_log (lvl=1, fmt=0x55e308 "[%s][%d][%s]: [server] recv SIGSEGV.pid:%d!\n") at ../src/log_xx.cpp:138
上面這個問題導(dǎo)致是因?yàn)檫M(jìn)程拋出了SEGV信號之后,在處理信號的方法中使用了非線程安全的localtime,而該方法中會枷鎖。
網(wǎng)站欄目:Linux進(jìn)程死鎖定位
新聞來源:http://aaarwkj.com/article44/iihihe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供軟件開發(fā)、虛擬主機(jī)、網(wǎng)站導(dǎo)航、電子商務(wù)、企業(yè)建站、定制開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)