首頁>科技>

早期雲計算的典型部署是,一兩個員工使用幾臺伺服器針對某個特定

需求搭建一個小規模私有云。然而,隨著整個企業中越來越多的員工使用

各種雲服務模型(laaS、PaaS、SaaS)中的大量功能,我們見識到的公有云

採用案例不勝列舉。更多的組織擴充套件對公有云服務的使用,它們小到初創

企業,大到全球最大的企業和政府。同時,大規模雲計算的各種問題也隨

之產生。

1.大規模公有云的潛在問題

毋庸置疑,各類企業透過採用公有云都會獲益匪淺。不過大規模地採

用公有云也伴隨著很多挑戰和風險,最主要的有如下幾方面:

1)成本。最初使用公有云時,僅允許有限的少數幾個人訪問,這時跟

未使用的“殭屍”例項、多餘的頻寬和儲存費用,以及其他一些不必要的

影響因素,這些不斷蠶食著預期的成本預算。

是隨著公有云的採用規模逐漸增加,管理將很快失控。公司的前僱員在離

職後可能仍然保留訪問許可權,員工的角色變化後,並沒有相應地更新訪問

許可權,新員工難以訪問到所需的資源等。由於多數雲服務提供者無法提供

企業級的安全保障,隨著逐步擴大公有云的採用規模,你將很快成為未經

授權的訪問的犧牲品。

3)惡意入侵。比員工的訪問許可權控制問題更嚴重的是外部對雲服務

的惡意入侵。密碼丟失、共享的使用者ID、資料洩漏、簡單密碼、社會工程

學、網路釣魚和惡意軟體都有可能使公有云服務暴露在資料丟失、墓改、

攻擊、拒絕服務和其他惡意入侵的威脅之下。

4)人為失誤。公有云服務規模較小時,透過人工就可方便地管理,但

隨著規模的不斷擴大,不可能持續地增加人力以維持其可管理性。這就意

味著更少的人做更多的工作,均衡法則告訴我們最終肯定會有人犯錯誤,

進而可能會導致大規模的故障。儘管這並不是雲服務獨有的問題。

5)可見性。當只有少數幾個服務時,管理可以很細緻,只要一兩個人

就可以瞭解這些服務的部署位置、配置方式、成本花費、使用情況、所屬

關係、問題原因、解決方案、服務關閉時間、恢復辦法等。然而,在規模

較大的系統中,隨著公有云部署規模的不斷擴大和更多用例的訪問放開,

雲的使用情況將變得越來越難以捉摸。

6)分類診斷。可見性差導致的後果之一就是使問題的分類診斷也變

得更加閒難。例如,如果不知道系統執行在哪裡或者它如何與其他的服

務連線,基本上就無法確定事務流變慢的原因。系統思維方面的專家愛德

華·戴敏曾經說過:“不可衡量者不可管理”。也許更恰當的說法是:“知己知彼,方能百戰不殆”。

7)可稽核性、可見性差的另外一個副作用就是,隨著越來越多的系統

和服務被抽象到雲服務中,追蹤誰在訪問什麼、何時、如何以及為什麼訪

問就變得越來越困難,與可稽核性有關的關鍵問題也就隨之而來。如果沒

有自動化的工具,在大規模雲環境下,跟蹤記錄和審查訪問、變更、故障、

曝光率、利用率等資訊將會變得非常困難。

8)可恢復性。儘管嚴重的停機故障並非雲所獨有,但是幾乎每週我們

別是商品化服務,並未內建恢復功能;即便是更加健壯的服務,也可能無

法提供及時的恢復服務或優先考慮某個使用者的業務需求。如果沒有系統可

用於備份、故障轉移和恢復,停機故障就在所難免且後果嚴重。

2.用自動化解決所有這些問題

所有這些問題的解決辦法就是IT自動化。當然,自動化並不是萬能

的;而且對有缺陷的流程進行自動化只能讓壞事在沒有控制的情況下執行

得更快。不過,如果實施得當,各種形式的自動化工具可以讓你在擴大公

有云部署規模的同時避免上述諸多問題。

1)流程自動化可以在更大的範圍、更廣的區域、以更低的成本快速地

執行和整合已有的任務和工作流,並且能夠為人們提供比預期更完善的審

計和控制。

2)供應自動化可以控制何人,何時、為何及如何建立和釋出何種雲服

務,從而減少錯誤,消除殭屍服務,並使得成本跟蹤和細粒度的審計和控

製成為可能。

3)配置自動化可以確保系統補丁得到及時安裝,使無用的埠得到及

時關閉,系統漏洞得到及時消除,費用超支得到及時控制,系統是可重用

的,並且能夠減少錯誤的發生。

4)甲使在最大型的雲計算部署申,事件監控也可隊眼煉到錯誤,並可

確很融發事件是清晰可見的、根本原因能被儘早確定,警報得到及時井級,

並且能在問題變得致命之前,及時發現並解決這些間題。

5)容器化可以提供更商層級的抽象,將使用者從某個雲計算基袖設施或

平臺的細節中抽離出來。這樣使用者就可以快速地完成從一個服務到另一個

眼務的低接觸(low=toueh)遷移,從而更好地滿足災難恢復和成本控制的

需求。

6)具有自動檢測、通知、升級及分類診斷間題能力的效能監控工具,

可提供必要的可視性,灘兔糟糕的體驗,預防由手間題診斷不善導致在雲

容量上花費過高而造成的成本超支。

7)備份和恢復自動化可讓故障對終端使用者完全透明,特別是當它們

與事件和效能監測工具相連時,或用於在雲應用中構建容錯和災難恢復機

制時。

8)釋出自動化可在不需要人工干預的情況下,將雲環境中的新應用和

更新應用自動從開發環境轉到生產環境,從而加速在大型部署環境中的創

新,同時降低人為失誤,確保可稽核性,並消除惡意程式碼。

9)身份及訪問管理可在需要時為使用者提供必要的雲服務訪問許可權,在

不需要時回收相應的許可權,從而達到防止惡意入侵、消除資料丟失、啟用

審計和控制、提升可見性以及控制使用成本的目的。

10)容量管理可以讓雲平臺的消費者更準確地預測他們的服務增長情

況和峰值需求,以及何時應該釋放資源,從而做到在幫助控制雲資源的成本的同時,減少潛在的服務問題。

此外,自動化讓公有云具備了之前透過傳統的手工方式無法具有的新

能力。例如,使用諸如DevOps之類的新手段可加速大規模應用程式的交

付,但這隻有在具有自助式供應、配置管理、測試自動化和釋出自動化等

解決方案的前提下才會可行。與此類似,如果沒有API訪問自動化、身份管理、資源運用和成本控制的解決方案,新興的雲API經濟中大量極好的

機會就會演變成巨大的風險,甚至可導致滅頂之災。

3.最關鍵的自動化工具

上述這些自動化工具和原則在公有云部署最佳實踐中都發揮了不同的作

用。在沒有了解具體部署案例的目標和限制之前,就輕言哪些自動化工具更

加關鍵是不合理的。當然,在多數情況下,一些工具確實要比另外一些工具

更加重要,如果非要選擇最重要的前3名自動化工具,可以選擇如下3個:

身份及訪問管理——如果不能保證正確的人在正確的時間能夠獲取

到正確的資源,那麼其他一切都是空談。假如對你來說,保護基於

雲環境的資料和服務是最大的顧慮,那麼身份及訪問管理就是必需

的自動化解決方案之一。

·供應自動化——對於許多雲服務來說,供應自動化是非常基礎的功

能,但是這一功能的粒度是非常關鍵的,特別是對審計和控制來說。

手工供應可能是造成公有云部署中人為失誤和成本超支的最大原因。

效能和可用性監測——這也許是所有部署的終極武器,即使在最大

型的大規模和高效能的雲部署環境下,也能夠讓你瞭解問題發生的

時間和原因,以及如何有效地修復這些問題。

對於現有的公有云服務來說,自動化能力是必不可少的。任何像樣一

點的雲服務肯定都會包含一些基礎的自動化能力,例如自助式供應、利用

率監測或退單拒付。然而,目前可能沒有哪一個雲服務提供者能提供更高

級的自動化能力,特別是商品化的雲服務。

在瞭解採用公有云的機會和風險之後,需要根據自身的工作量和目標

合理地選擇正確的服務提供商,並使用適當的自動化工具對其進行補充。

只有正確地整合自動化解決方案,提供給使用者,並增強了信心、安全、性

能、速度和控制,才能夠完全發揮公有云的潛能。

8
  • 整治雙十一購物亂象,國家再次出手!該跟這些套路說再見了
  • 學習庫克廉價版大招!三星價效比旗艦機來襲:狙擊國產5G旗艦機