AI-Ops
智慧運維(AI-Ops)
透過AI技術來改善運維團隊的工作方式
AI的兩個含義
使用現代人工智慧在實現IT運維自動化
最早的叫法
Algorithmic IT
使用自動化和規則來執行IT運維
AI-Ops並不是一個全新的理念,而是IT運營分析和管理(ITOA/ITOM)體系與大資料和人工智慧技術結合的產物。AI-Ops智慧運維以ITOA/ITOM系統所採集的運維大資料為基礎,利用人工智慧和機器學習演算法對運維資料進行深入分析,涵蓋IT監控,應用效能管理、網路監控、日誌分析,系統安全等方面。
根據艾瑞諮詢、Gartner等機構的資料顯示,中國企業IT運維已是千億級市場,2016年為5231.8億元的市場規模,並且以16%的複合年均增長率高速增長,預計到2020年,將達到9463.9億元的市場規模。
在企業IT運維的發展過程中,存在著IT運維難度大幅提高,成本急劇上升的現狀,相關調查顯示,90%使用混合雲的企業,81%使用多雲的企業均遇到以上問題。在部署上,系統部署慢,專案啟動晚;在遷移時,系統複雜,雲遷移難;在運維中,管理工具多,統一難,使得IT運維效率較低。而人員的流動性高,運維經驗缺乏;業務開展中,系統的不穩定性,拓展受阻;以及運維不當,資訊保安隱患多等問題,造成了成本的居高不下。
在這樣的發展背景下,高效率、低成本的AIOps無疑將是企業IT運維剛需所在。據Gartner等報告宣稱,到2020年,近50%的企業將在他們的業務和IT運維方面採用AIOps,遠高於2017年的5%。
當系統越來越多,越來越複雜
最終導致警報、故障排除、管理更困難
故障診斷和修復工作
需要花費數個小時、數天甚至數週
這麼多問題該如何解決?
幾秒鐘就能搞定工作難題該如何實現?
AI-Ops孕育而生
✨
提供了哪些技術亮點?
帶來了哪些價值?
解決了哪些技術問題?
關鍵技術
01
人工智慧(AI)——使用深度學習神經網路等人工智慧技術來充分理解不同系統之間發生時間的方式和原因。使用專家規則系統和推理引擎作為自動化故障排除和自動修復的一部分。
02
機器學習(ML)——使用先進的數學技術分析、預測、警報和建模各種系統,伺服器、服務、日誌、警報等等。
03
大資料(BD)——一切都基於大資料,數十萬個數據點位於500,000個不同的指標(每個伺服器和服務數百個資料點)上。
關鍵價值
1.加分項:告警
更多、更快的警報,減少重複、錯誤警報
2.加分項:登入
更好地分析,更方便地發現與解決問題
3.加分項:系統性能
最佳化系統性,解決效率不高的服務
4.減分項:排查時間
更多系統自動修復與更快的備份
5.減分項:更少的人員
更少的人員與資源成本
6.減分項:成本控制
自動化減少人員工作量
解決問題
異常檢測
高階警報以更快的速度查詢實際問題
事件管理
登入分析
更強大的自動化運維、排查支援
專業排查
更快的問題解決
深度分析
運營機器學習,人工智慧,資料指標、模型,進行深度學習
自動修復
基於人工智慧,自動修復問題
動態建模
基於機器學習,更好地理解關係及超載失敗
關係分析
整理/夏立成 上海藍盟創始人,IT外包服務專家,復旦校友創新創業俱樂部副會長,專注創業、運動和公益。
AI-Ops
智慧運維(AI-Ops)
透過AI技術來改善運維團隊的工作方式
AI的兩個含義
使用現代人工智慧在實現IT運維自動化
最早的叫法
Algorithmic IT
使用自動化和規則來執行IT運維
AI-Ops並不是一個全新的理念,而是IT運營分析和管理(ITOA/ITOM)體系與大資料和人工智慧技術結合的產物。AI-Ops智慧運維以ITOA/ITOM系統所採集的運維大資料為基礎,利用人工智慧和機器學習演算法對運維資料進行深入分析,涵蓋IT監控,應用效能管理、網路監控、日誌分析,系統安全等方面。
根據艾瑞諮詢、Gartner等機構的資料顯示,中國企業IT運維已是千億級市場,2016年為5231.8億元的市場規模,並且以16%的複合年均增長率高速增長,預計到2020年,將達到9463.9億元的市場規模。
在企業IT運維的發展過程中,存在著IT運維難度大幅提高,成本急劇上升的現狀,相關調查顯示,90%使用混合雲的企業,81%使用多雲的企業均遇到以上問題。在部署上,系統部署慢,專案啟動晚;在遷移時,系統複雜,雲遷移難;在運維中,管理工具多,統一難,使得IT運維效率較低。而人員的流動性高,運維經驗缺乏;業務開展中,系統的不穩定性,拓展受阻;以及運維不當,資訊保安隱患多等問題,造成了成本的居高不下。
在這樣的發展背景下,高效率、低成本的AIOps無疑將是企業IT運維剛需所在。據Gartner等報告宣稱,到2020年,近50%的企業將在他們的業務和IT運維方面採用AIOps,遠高於2017年的5%。
當系統越來越多,越來越複雜
最終導致警報、故障排除、管理更困難
故障診斷和修復工作
需要花費數個小時、數天甚至數週
這麼多問題該如何解決?
幾秒鐘就能搞定工作難題該如何實現?
AI-Ops孕育而生
✨
提供了哪些技術亮點?
帶來了哪些價值?
解決了哪些技術問題?
關鍵技術
01
人工智慧(AI)——使用深度學習神經網路等人工智慧技術來充分理解不同系統之間發生時間的方式和原因。使用專家規則系統和推理引擎作為自動化故障排除和自動修復的一部分。
02
機器學習(ML)——使用先進的數學技術分析、預測、警報和建模各種系統,伺服器、服務、日誌、警報等等。
03
大資料(BD)——一切都基於大資料,數十萬個數據點位於500,000個不同的指標(每個伺服器和服務數百個資料點)上。
關鍵價值
1.加分項:告警
更多、更快的警報,減少重複、錯誤警報
2.加分項:登入
更好地分析,更方便地發現與解決問題
3.加分項:系統性能
最佳化系統性,解決效率不高的服務
4.減分項:排查時間
更多系統自動修復與更快的備份
5.減分項:更少的人員
更少的人員與資源成本
6.減分項:成本控制
自動化減少人員工作量
解決問題
異常檢測
高階警報以更快的速度查詢實際問題
事件管理
登入分析
更強大的自動化運維、排查支援
專業排查
更快的問題解決
深度分析
運營機器學習,人工智慧,資料指標、模型,進行深度學習
自動修復
基於人工智慧,自動修復問題
動態建模
基於機器學習,更好地理解關係及超載失敗
關係分析
基於機器學習,更好地理解關係及超載失敗
整理/夏立成 上海藍盟創始人,IT外包服務專家,復旦校友創新創業俱樂部副會長,專注創業、運動和公益。