回覆列表
  • 1 # 國際科技資訊

    伺服器宿機在什麼情況下會發生?怎麼解決?必須首先了解什麼是宕機遷移。

    一、什麼是宕機遷移?

    宕機遷移是阿里雲提供的物理機宕機保護使用者手段之一,指部署在物理機上雲伺服器由於底層物理機效能出現異常或者其他原因都會導致物理機宕機時,系統會啟動保護性遷移,將其上受影響的雲伺服器遷移到效能正常的物理機上,在這過程中我們會給使用者傳送宕機遷移簡訊讓使用者知曉。 (也叫宿主機例項服務中斷)

    二、出現了宕機遷移我該怎麼辦,如何儘快恢復應用?

    1)建議使用者把應用程式設定成開機自動啟動,避免的遷移後伺服器起來後應用程式沒有啟動。

    2)如果應用服務連線資料庫,需要在程式中設定成自動重連機制,網上可以搜尋到一些mysql,tomcat等自動重連的設定方法。

    3)可以將多臺機器做SLB負載均衡使用,防止出現單點故障or宕機遷移失敗的情況(一臺伺服器宕機,另一臺服務其可以持續對外提供訪問)

    在公共雲遷移期間,IT團隊需要採取謹慎的步驟,以避免聽到“系統宕機”這種可怕的提示。

    隨著組織遷移到基於雲計算的基礎設施,IT團隊需要在遷移過程中保持可用性。但是,考慮到所有複雜性,在雲計算遷移過程中,防止宕機或最小化停機時間並不容易。雲計算團隊需要考慮資料不一致,監控不同的軟體版本,並檢查其網路連線是否成功。

    如果企業的應用程式崩潰,業務往往會停止。雖然精確的指標因企業和應用的情況而異,但調研機構Gartner公司在2014年發現,網路停機時間平均每分鐘的損失為5,600美元。停機時間的高昂成本是企業往往將最複雜的工作負載遷移到另一個平臺(包括雲計算)的原因之一。

    企業仍然快速地採用公共雲。據調研機構Forrester Research公司預計,2017年全球公共雲市場將達到1460億美元,遠高於2015年的870億美元。

    朦朧的前景

    對於選擇遷移到雲端的企業來說,其前景是好是壞尚不明確。任何雲計算遷移過程都是艱難的,移動資訊需要大量的時間和精力,即使生產和目標系統完全相容。而企業的雲計算提供商執行的系統與其內部使用的系統相同的機率很小,因此雲遷移挑戰呈指數級增長。

    在另一方面,如今的計算基礎設施比以往更加模組化了。

    Forrester Research公司首席分析師兼私人基礎架構即服務雲主管Lauren E. Nelson表示:“虛擬化使得企業將工作負載從一個系統轉移到另一個系統變得更加容易。”

    虛擬化建立了一個抽象層,所以軟體不像過去那樣依賴於系統特性。應用程式不再與作業系統緊密相連,並且往往會依賴於那些可用的伺服器資源。其缺點是現代工作負載通常是龐大而複雜,大多數功能都是數十萬行程式碼。此外,由於採用模組化的方式,它們與許多其他系統(如用於身份管理的系統)可以進行互動。

    雲遷移過程從哪裡開始

    將所有應用程式和支援基礎設施移動到公共雲中是不可行的。Nelson說:“企業有大量的應用,遷移過程需要6到18個月的時間。”

    將雲計算遷移過程分解為可管理的步驟。從最小最簡單的專案開始,然後再進行更大,更復雜的部分工作。在遷移過程中,同時執行內部部署和雲系統,同步資料並測試雲部署,以確保轉移過程中沒有任何內容丟失。另外,記錄所有的API,以瞭解在雲遷移過程中需要監視哪些API。

    當企業將舊介面對映到新介面時,其最重要的就是細節。例如,應用程式可以執行4.0版本的使用者介面,而云端供應商是4.1版本,其中可能包括應用程式不支援的功能,並阻止系統正常執行。

    定製和網路帶來遷移的挑戰

    區分企業服務或簡化操作的定製應用程式在雲遷移過程中創造了額外的挑戰。當企業修改應用程式時,通常會建立一個附加元件或編寫軟體。如果雲計算供應商缺乏支援獨特功能所需的軟體,則此自定義可能會產生問題。

    新的提供商服務增加了複雜性

    雲計算提供商服務的快速發展使得一致性更加困難。雲計算供應商正在從事高風險的競爭,提供新服務。因此,應用程式今天可能會透過遷移測試,但是明天就會不合格。

    網路通訊是公共雲的另一個關鍵因素。當組織將資訊從現場遷移到場外時,他們需要確保其WAN鏈路的速度足夠快以提供足夠的效能。在某些情況下,這將需要升級。

    將工作負載移至雲計算時,企業面臨諸多挑戰,但公共雲供應商提供工具和服務來簡化雲遷移流程。此外,埃森哲,CDW,CloudMigrator,Dell Technologies,Metalogix,Vision Solutions和Zenoss等第三方供應商也提供類似的服務。

    雲伺服器遷移發生宕機故障該如何避免?

    隨著企業業務不斷的遷移到基於雲伺服器的基礎設施,IT團隊需要在遷移過程中保持可用性。但是,考慮到所有複雜性,在遷移雲伺服器過程中,防止宕機或最小化停機時間並不容易。雲伺服器團隊需要考慮資料不一致,監控不同的軟體版本,並檢查其網路連線是否成功。那麼如果雲伺服器遷移過程中出現宕機故障使用者該如何避免呢?

    首先我們知道,雲伺服器是部署在物理機上的,底層物理機效能如果出現異常或者其他原因,都會導致物理機宕機。當檢測到雲伺服器所在的物理機發生故障,系統會啟動保護性遷移,將你的伺服器遷移到效能正常的宿主機上。

    一旦發生宕機遷移,你的伺服器就會被重啟,如果你希望你的伺服器重啟以後應用伺服器自動恢復,需要你把應用程式設定成開機自動啟動,如果應用服務連線的資料庫,需要在程式中設定成自動重連機制。

    最後,為了儘量避免發生宕機遷移這種狀況發生,我們在選擇雲伺服器的時候要特別注意伺服器的穩定效能。

    除了雲伺服器本身之外,我們也可以做一些措施來避免:

    1、資料備份

    傳統資料備份還將繼續存續下去。在某些環境下,它還可以很好地發揮作用,現在還沒有理由和/或預算去替換它。

    雲伺服器、雲備份等產品及服務的確為眾多企業,尤其是中小企業帶來了便利,但云伺服器同時又是一把雙刃劍,在發生問題時給企業帶來等影響和損失也是非常巨大的。因此,如果你在雲伺服器商儲存重要資訊,你一定要確保有一份備份,備份的越多越好。

    2、使用一個以上個的雲伺服器

    不要把雞蛋放在一個籃子裡。意思就是如果你的預算充足,請考慮使用一個以上的雲伺服器提供商。這種做法雖然比較複雜,但確實很有效。

    3、防範於未然

    你永遠不知道自己所依賴的雲端伺服器什麼時候會突然癱瘓,就像這次谷歌資料庫被閃電擊中一樣,導致部分資料丟失,因此,“防範於未然”通常都能夠幫助使用者減少在災難發生時候的損失。

  • 2 # 因為你69608903

    隨著網際網路的深入發展,面對各種網路技術,資料儲存和傳輸變得越來越重要。作為網際網路基礎設施的伺服器,其安全性和穩定性越來越重要。當然,無論伺服器有多好,在使用過程中不可避免地會出現一些問題,其中伺服器宕機是最常見的問題。下面宵雲就和大家說一說伺服器宿機的常見原因是什麼?如何解決?

    首先,伺服器宕機的常見原因:

    1、伺服器執行環境

    “執行環境”可以說是導致伺服器停機的最常見原因。伺服器執行環境可以看作是支援資料庫伺服器執行的系統和資源的集合,包括作業系統、硬體和網路。在這類問題中,最常見的問題是磁碟空間耗盡。

    2、伺服器效能

    伺服器效能也是導致停機的一個因素。因此,當伺服器負載增加時,應該注意升級配置。

    3、複製問題

    複製問題通常是由於主備資料不一致造成的。

    4、資料丟失或損壞

    資料丟失問題通常是由錯誤操作引起的,並且總是伴隨著缺少可用備份。

    如何解決伺服器停機的問題?

    及時發現和分析的時間是很有意義的。我們應該及時分析伺服器停機的問題,如應用程式是否導致記憶體溢位或洩漏;程序是否建立過多或持續建立,導致資源耗盡;應用程式是否異常;是否由駭客入侵攻擊引起;是。是否由誤操作等引起。當伺服器停機時,為了避免不必要的損失,應儘快通知雲服務提供商解決相關問題。

    更適合用於兩臺Web伺服器。它們儲存相同的內容,但IP不同,機房的位置也不同。這樣,兩臺主機同時停機的可能性大大降低。當首次發現停機問題時,可以快速修復域名記錄,以指向當前正常的網站空間。

  • 3 # 極端吐槽

    伺服器宕機幾乎是一種比較常見的情況,它發生的原因有很多種,而且各種條件都很複雜,不過都達成了相同的效果,就是伺服器無法再為使用者處理資料了。

    我就稍微列舉一下通常伺服器宕機可能得情況。

    1.系統錯誤

    這種情況發生得一般最常見,由於使用者的錯誤設定,或者是一些軟體的衝突,資料的損失,以及一些硬體的原因,導致伺服器系統無法正常執行。比如防火牆的錯誤設定,引起網路無法連線。

    2.伺服器超載

    由於程式執行,或者中毒的情況下,導致伺服器磁碟讀寫,CPU,記憶體滿載,就會引起系統崩潰自動重啟。這種情況出了正常使用,也會在被網路攻擊的時候出現,比如CC流量攻擊。

    3.機房空路由

    這種情況常見於被DDOS攻擊,一般的機房都會選擇在達到一定量的時候,解除IP與伺服器的繫結,導致伺服器無法請求和訪問,只能等待一定時間後自動恢復。

    最後,做好伺服器的安全防護比如cdn等,以及做好資源的分配,程式的限制等很重要。畢竟資料是無價,服務的穩定也是使用者維持的關鍵。

  • 4 # VP—GAO高哥

    伺服器宕機籠統分為1)外部環境原因引起的宕機:外部電源故障,周圍環境原因溫度溼度異常等;2)人為操作失當引起,通常是系統管理員操作失誤。3)裝置硬體故障,主機板,CPU,記憶體,磁碟陣列,網絡卡等故障引起的。4)軟體故障:作業系統BUG,基礎軟體故障(資料庫,中介軟體等),應用軟體BUG,病毒軟體攻擊等。5)網路故障:網路協議BUG,或網路攻擊等引起。

    應對伺服器宕機從裝置級到網路級有多種手段,早期的叢集,HA,到現在的虛擬化,雲化都是解決單機宕機的手段。

  • 5 # NO1葫蘆娃看電影

    伺服器宕機可以分為兩種:假宕機和宕機 

      

      假宕機(非藍色畫面宕機)是由於硬體資源暫時性地被消耗殆盡,因而無法對外部指令進行響應的現象, 通常是網站處於訪問高峰期,頻寬等資源跑滿,這時只需要等待一定的時間,待伺服器騰出更多的硬體資源即可恢復正常, 

     

      而宕機,如果透過ping測試伺服器,鍵盤切換數字鎖定鍵(NumLock)或大寫鎖定鍵(Caps Lock)功能, 顯示器無畫面輸出,或者滑鼠游標沒有任何反應則表明伺服器硬體故障 

     

     

      伺服器出現宕機的常見原因 

      

      1.在執行環境的問題中,最普遍的問題時磁碟空間耗盡。 

     

      2..在效能問題中,最普通的伺服器宕機原因確實是執行很糟糕的SQL, 但也不一定都是這個原因,比如也有很多問題時由於伺服器Bug或錯誤的行為導致的。 

     

      3..糟糕的Schema和索引設計是第二大影響效能的問題。 

     

      4..複製問題通常由於主備資料不一致導致。 

     

      5.資料丟失問題通常由於drop table的錯誤操作導致,並總是便隨著缺少可用備份的問題。 

     

     

      如何檢視伺服器宕機的原因 

     

      a、是否是應用程式導致記憶體溢位或者洩露,out of memory導致 

     

      b、是否是程序過多或者不斷建立,耗盡資源導致 

     

      c、是否是資料庫程式死鎖,連線數過多導致 

     

      d、是否是應用程式異常導致 

     

      e、是否是流量負載過大導致 

     

      f、 是否是遭受駭客入侵攻擊導致 

     

      g、是否是誤操作導致

  • 中秋節和大豐收的關聯?
  • 愛情是否真的是必需品?