尹元,現(xiàn)任“勤智運維”京津冀區(qū)域技術(shù)經(jīng)理,曾大量參與企事業(yè)單位運維需求調(diào)研與規(guī)劃工作,在運維監(jiān)控、流程處理等方面有豐富經(jīng)驗。
人工智能是當(dāng)下最火爆的前沿技術(shù),是計算機科學(xué)最值得期待的一個分支,目的是研制出模仿人類思考邏輯和行動的智能化機器??蒲腥藛T嘗試用各種方式讓機器人替代人類從事差別類型的工作,從最開始的重體力勞動到繁復(fù)的精密加工到未來替代人類進行邏輯思考。智能化將大大減輕人的勞動,以最少的人工干預(yù)完成復(fù)雜的工作。
如果將智能化概念引入運維領(lǐng)域?qū)l(fā)生什么變革呢?我們可以想象一下,用智能化程序代替運維人員,能夠在最少的人員干預(yù)下使用故障探測技術(shù)尋找業(yè)務(wù)運行中的故障點,發(fā)生故障時通過問題分析引擎快速定位故障根源尋找解決方案,并能夠自動運行預(yù)制腳本與工具嘗試進行故障的修復(fù),最后還能夠按照袒露出來的問題進行深入的關(guān)聯(lián)分析,找出潛藏的隱患并制定解決預(yù)案。智能化運維的終極目標(biāo),就是將運維人員從繁瑣的工作中解放出來,提高整體運維效率,降低運維成本,實現(xiàn)業(yè)務(wù)系統(tǒng)的高可用性。
運維環(huán)境的異構(gòu)和復(fù)雜化,導(dǎo)致日常運維工作需要付出的人力、時間成本越來越高。 2015 年智能化運維開始被大家廣泛關(guān)注,隨著大數(shù)據(jù)分析、APM、智能異常檢測、自動學(xué)習(xí)等技術(shù)的興起和逐漸成熟,運維需求也逐漸向智能化和自動化過渡。從最初級運維發(fā)展到現(xiàn)在智能化運維,可以劃分為 4 個階段:
1、腳本時代
運維人員通過手工的方式做設(shè)備巡檢,嘗試著用SSH腳本等方式進行系統(tǒng)維護。
2、工具時代
運維人員使用各廠商推出一些辦理工具,通過使用這些運維工具進行系統(tǒng)辦理。
3、平臺時代
隨著運維工具逐步增多、網(wǎng)絡(luò)環(huán)境異構(gòu)、信息孤島逐漸產(chǎn)生等情況,需要一套統(tǒng)一的運維平臺將工具進行整合。
4、智能化時代
異構(gòu)化環(huán)境,對數(shù)據(jù)分析和自動化的要求越來越高,借助海量的運維數(shù)據(jù)優(yōu)化改進當(dāng)前工作方法,日常工作實現(xiàn)無人值守的機器運維。建立在大數(shù)據(jù)分析和自動化運維基礎(chǔ)上的智能化運維時代。
運維的精細(xì)化要求越高,就需要積累更多的能力輔助智能化運維場景和策略,實現(xiàn)更多辦理途徑的擴展。下面,簡單舉例來暢想下一步趨勢。
1、在平臺化運維系統(tǒng)的基礎(chǔ)上,想要進行多系統(tǒng)、多業(yè)務(wù)的整合,僅僅通過接口遠(yuǎn)遠(yuǎn)不夠,還需要更加深入的數(shù)據(jù)關(guān)聯(lián),模糊業(yè)務(wù)系統(tǒng)與運維平臺之間的界限。
2、更強大的故障探測能力,能夠深入業(yè)務(wù)多個層次進行故障挖掘,逐層檢索業(yè)務(wù)運行數(shù)據(jù),分析業(yè)務(wù)運行情況,關(guān)心業(yè)務(wù)關(guān)鍵節(jié)點,快速發(fā)現(xiàn)問題,及時通知運維人員并啟動緊急預(yù)案。
3、故障緊急預(yù)案針對發(fā)現(xiàn)隱患、異常、告警、故障、預(yù)測等多種運維場景,并提供相對應(yīng)的解決預(yù)案,可以通過自動或者手動的方式快速執(zhí)行。
4、緊急預(yù)案失效時可以提供大數(shù)據(jù)的強力支持,實時分析問題根源與可能的故障隱患,提供更加快速、正確的故障判斷能力。同時,提供自動學(xué)習(xí)的可能,將現(xiàn)在發(fā)生的故障場景記錄下來生成新的解決預(yù)案。
5、與流程的結(jié)合,能夠?qū)崿F(xiàn)整體運維事件的閉環(huán),提供事件的記錄、跟蹤、處理、反饋等關(guān)鍵節(jié)點,保障運維工作高效運行。
以往的簡單運維,都是通過彼此獨立的運維工具或網(wǎng)管軟件來實現(xiàn)日常辦理,通過不尺度的數(shù)據(jù)和不統(tǒng)一的告警進行人工分析。智能化運維能夠?qū)⒏盍训南到y(tǒng)進行整合,并提供尺度接口。運維整合,表現(xiàn)在數(shù)據(jù)的采集、分析、匯總、處理、總結(jié)、預(yù)案等幾個層面。
那么,這些又將如何落地呢?一直從事“一體化智能運維”研究的勤智運維,給出了本身的初步研究成果。