我們知道,不管是雲伺服器還是物理伺服器,絕大多數都是託管在遠端機房的,此時伺服器的執行狀態我們就不能及時掌控的。
伺服器全天候執行時,不排除伺服器會有宕機的可能。作為伺服器運維人員而言,當伺服器上的服務不可用時,如何快速判斷是伺服器宕機導致的還是其它原因導致的呢?下面結合我的運維經驗談談我對於此問題的看法。
1、檢視伺服器是否能ping通
如果你的伺服器沒有禁止ICMP響應,那可以透過ping命令檢視伺服器是否有響應。
如果伺服器沒有禁ping,此時ping伺服器IP又不通時,就說明伺服器不是線上狀態了。
2、檢視是否能進入遠端桌面進行操作
如果是Windows伺服器,我們就用遠端桌面工具連線伺服器;如果是Linux伺服器,我們使用XShell或者Putty或者iTerm這類終端工具連線伺服器。
如果伺服器無法連線上,說明伺服器沒有響應,可能原因有:
伺服器頻寬被佔滿;
伺服器宕機;
3、雲伺服器請登入控制面板檢視伺服器執行狀態
如果是雲伺服器,那我們可以第一時間登入控制面板檢視雲服執行狀態(是否在執行中、記憶體及CPU佔用率情況、頻寬佔用率情況)。
如果伺服器是執行中狀態,但CPU、記憶體、頻寬中的一種佔滿了,那伺服器基本上就是宕機了,可以強制重啟伺服器,然後進一步處理。
物理伺服器如果無法判斷伺服器執行狀態,請第一時間聯絡機房客服人員協助檢視伺服器執行狀態是否正常。
5、透過站點訪問統計工具判斷網站訪問量是否處於高峰
綜上所述,伺服器宕機時的表現主要有以下幾點:
伺服器上的所有服務均無法訪問,比如說:WEB站點無法訪問、資料庫無法訪問、無法登入伺服器、FTP無法使用等;而無法遠端登入伺服器時就已經說明伺服器狀態異常了!
雲服管理面板或者機房客服反饋說伺服器記憶體佔滿、CPU佔滿、寬頻佔滿;
伺服器受到流量攻擊時也會造成宕機現象,而這種攻擊留下的現象就是伺服器的上行頻寬全部佔滿。
一般而言,伺服器宕機原因主要是軟體及系統出現故障或者是硬體存在故障導致,我們從宕機狀態恢復後要檢視伺服器日誌來具體定位事故原因。
硬體方面:硬體上最為常見的就是硬碟損壞、裝置插槽鬆動等情況下最容易導致宕機。
軟體及系統方面:比如說一些軟體存在死迴圈、軟體崩潰、系統Bug會導致伺服器宕機。
我們知道,不管是雲伺服器還是物理伺服器,絕大多數都是託管在遠端機房的,此時伺服器的執行狀態我們就不能及時掌控的。
伺服器全天候執行時,不排除伺服器會有宕機的可能。作為伺服器運維人員而言,當伺服器上的服務不可用時,如何快速判斷是伺服器宕機導致的還是其它原因導致的呢?下面結合我的運維經驗談談我對於此問題的看法。
判斷伺服器是否宕機的方法1、檢視伺服器是否能ping通
如果你的伺服器沒有禁止ICMP響應,那可以透過ping命令檢視伺服器是否有響應。
如果伺服器沒有禁ping,此時ping伺服器IP又不通時,就說明伺服器不是線上狀態了。
2、檢視是否能進入遠端桌面進行操作
如果是Windows伺服器,我們就用遠端桌面工具連線伺服器;如果是Linux伺服器,我們使用XShell或者Putty或者iTerm這類終端工具連線伺服器。
如果伺服器無法連線上,說明伺服器沒有響應,可能原因有:
伺服器頻寬被佔滿;
伺服器宕機;
3、雲伺服器請登入控制面板檢視伺服器執行狀態
如果是雲伺服器,那我們可以第一時間登入控制面板檢視雲服執行狀態(是否在執行中、記憶體及CPU佔用率情況、頻寬佔用率情況)。
如果伺服器是執行中狀態,但CPU、記憶體、頻寬中的一種佔滿了,那伺服器基本上就是宕機了,可以強制重啟伺服器,然後進一步處理。
物理伺服器如果無法判斷伺服器執行狀態,請第一時間聯絡機房客服人員協助檢視伺服器執行狀態是否正常。
5、透過站點訪問統計工具判斷網站訪問量是否處於高峰
伺服器宕機時的現象有哪些?綜上所述,伺服器宕機時的表現主要有以下幾點:
伺服器上的所有服務均無法訪問,比如說:WEB站點無法訪問、資料庫無法訪問、無法登入伺服器、FTP無法使用等;而無法遠端登入伺服器時就已經說明伺服器狀態異常了!
雲服管理面板或者機房客服反饋說伺服器記憶體佔滿、CPU佔滿、寬頻佔滿;
伺服器受到流量攻擊時也會造成宕機現象,而這種攻擊留下的現象就是伺服器的上行頻寬全部佔滿。
導致伺服器宕機的因素有哪些?一般而言,伺服器宕機原因主要是軟體及系統出現故障或者是硬體存在故障導致,我們從宕機狀態恢復後要檢視伺服器日誌來具體定位事故原因。
硬體方面:硬體上最為常見的就是硬碟損壞、裝置插槽鬆動等情況下最容易導致宕機。
軟體及系統方面:比如說一些軟體存在死迴圈、軟體崩潰、系統Bug會導致伺服器宕機。