2021-01-30 分類: 網(wǎng)站建設(shè)
問題描述
Linux 內(nèi)核有個機制叫 OOM killer(Out-Of-Memory killer),該機制會監(jiān)控那些占用內(nèi)存過大,尤其是瞬間很快消耗大量內(nèi)存的進程,為了防止內(nèi)存耗盡而內(nèi)核會把該進程殺掉。
典型的情況是:某天一臺機器突然 ssh 遠程登錄不了,但能 ping 通,說明不是網(wǎng)絡(luò)的故障,原因是 sshd 進程被 OOM killer 殺掉了(多次遇到這樣的假死狀況)。重啟機器后查看系統(tǒng)日志「/var/log/messages」會發(fā)現(xiàn)「Out of Memory: Kill process 1865(sshd)」類似的錯誤信息。
如何防止重要的系統(tǒng)進程觸發(fā)(OOM)機制而被殺死呢?只需要一招,就可以輕松避免。
設(shè)置參數(shù)「/proc/PID/oom_adj為-17」,可臨時關(guān)閉 Linux 內(nèi)核的 OOM 機制。內(nèi)核會通過特定的算法給每個進程計算一個分數(shù)來決定殺哪個進程,每個進程的 OOM 分數(shù)可以在「/proc/PID/oom_score」中找到。
處理辦法
1. 方法一:設(shè)置參數(shù)/proc/PID/oom_adj為-17
如何防止mongod被殺,可以這樣操作:
(1) 編寫腳本文件oomadj.sh,內(nèi)容如下:
- #!/bin/bash?
- netstat?-ntlup?|grep?mongod?|awk?'{print$NF}'?|awk?-F?'/'?'{print$(NF-1)}'?|while?read?PID;?
- do?
- echo?-17?>/proc/$PID/oom_adj;?
- done?
(2) 設(shè)置定時計劃
- [root@mnkj-mongodb-01?~]crontab?-e?
- */1?*?*?*?*?/root/oomadj.sh?
至于為什么用-17而不用其他數(shù)值(默認值為0),這個是由linux內(nèi)核定義的,查看內(nèi)核源碼可知:
以 linux-3.3.6 版本的 kernel 源碼為例,路徑為「linux-3.6.6/include/linux/oom.h」,閱讀內(nèi)核源碼可「oom_adj」的可調(diào)值為 15 到 -16,其中 15 大-16 最小,-17 為禁止使用OOM。「oom_score」為 2 的 N 次方計算出來的,其中 N 就是進程的「oom_adj」值,所以「oom_score」的分數(shù)越高就越會被內(nèi)核優(yōu)先殺掉。
2. 方法二:修改內(nèi)核參數(shù)禁止OOM機制
- #?sysctl?-w?vm.panic_on_oom=1?
- vm.panic_on_oom?=?1?//1表示關(guān)閉,默認為0表示開啟OOM?
- #?sysctl?-p?
注意事項
注意:
OOM killer 是保證系統(tǒng)內(nèi)存不被個別進程消耗殆盡非常實用的機制,但是在實際工作除了進程運行過多會造成內(nèi)存占用過高,還有很多其他的因素比如:訪問增多、遭受攻擊等...
這時我們不僅要使用好 OOM killer,更需要關(guān)注服務(wù)器的資源使用情況,需要完善的實時監(jiān)控體系,能夠?qū)τ谙到y(tǒng)存在問題能夠及時的發(fā)現(xiàn)并處理,保證業(yè)務(wù)穩(wěn)定運行。
網(wǎng)頁標題:還在擔心服務(wù)器進程被OOM?只需一招,即可避免
URL標題:http://aaarwkj.com/news36/98136.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、App設(shè)計、網(wǎng)站策劃、搜索引擎優(yōu)化、做網(wǎng)站、面包屑導航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容