云計算時代的到來給人們帶來了很多便利,同時也帶來了挑戰(zhàn)。比如,硬件環(huán)境更加復雜、設備多樣、處理難度大,運行的平臺系統更加多樣化,需要更廣的知識面,對運維安全要求也更高,所以在云環(huán)境下,我們需要對云運維平臺 進行可視化管理。
運維可視化核心是將所運維的服務、資源、設備的狀態(tài)和正在發(fā)生的事件通過可視化的手段呈現出來,指導運維人員或者產品研發(fā)人員做出正確的運維決策。某種程度上,云平臺的運維與可視化相輔相成,可視化程度越高,運維就越簡單,運維效率也就越高。
在云運維的工作范疇中,實時監(jiān)控對故障的發(fā)現和診斷起到至關重要的作用。今天,我們以私有云監(jiān)控中的一個重點場景——內網監(jiān)控為例,來介紹可視化的重要作用(內網指的是一個企業(yè)的內部網絡,包括機房內部網絡和機房間的網絡)。
異常事件可視化
當運維工程師發(fā)現自己負責的系統出現故障時,檢查網絡連接是否有異常,是故障排查流程當中的標準步驟。在這個場景中,工程師需要知道自己的系統所在的機房以及所依賴的網絡通路是否存在故障,所以希望內網監(jiān)控系統提供一個網絡故障概覽,展示給定的時間段中相關機房的異常事件。
最簡單的方式是將所有的網絡故障展示在表格當中。
如上表所示,每一行代表一個故障事件。
這種展現方式存在以下三個問題:
當時間段很長,篩選出的故障事件很多時,表格會變得很長,就更加不利于工程師了解網絡狀況。
為解決以上問題,我們需要在機房、時間、 程度三個維度上都能直觀的展示故障事件。從時間跨度來想,有點像事件流的感覺,似乎可以用事件流圖來展示。
圖1 事件流圖
如圖1所示,事件流圖用一條事件河流來表示事件。河流被橫向切分為若干條色帶,每條色帶代表一個類別的事件。色帶的高度(河流的寬度)代表在某個時刻,各類別包含事件的個數。事件越多,河流越寬,反之越窄。
這種事件流圖適合展示在一段時間內事件群體的統計變化,而我們需要能夠展示每個事件的個體信息。因此,我們對事件流圖作了幾個修改:
圖2 異常事件流圖
圖2展示了我們的事件流圖方案。
圖中展示了三個機房的異常,其中機房一有1個嚴重的異常事件(用紅色來標識),這個異常事件是一個時間跨度比較長的嚴重異常事件。機房二有4個輕度的異常事件(用黃色標識),這4個異常是時間跨度比較短的輕度異常事件,機房三有12個輕度的異常事件(用黃色標識),這12個異常事件中也有三個時間跨度比較長的時間。如果鼠標放置在異常事件矩形塊上,就能查看哪個機房出現異常。
通過這個圖,工程師可以很方便地看到每個機房的每個故障事件的詳細信息,比表格的方式直觀得多。
總結
事件流圖,從機房、時間、異常程度三個維度都能直觀的展示故障事件,幫助工程師快速查看異常情況。其實,事件流圖還可以用于展示變更事件,甚至可以將變更事件與異常事件組合,讓工程師能一眼查看異常事件可能是由哪些變更事件引起的。
我們從智能運維場景中抽象出一些可視化組件,比如這里的事件流圖組件,再通過前端工程化工具把這些子元素串聯起來,構建出前端統一展現層框架,后面我們會逐一介紹這些可視化組件與框架其他細節(jié)。
將BIM模型應用在運維階段,應根據業(yè)主、BIM團隊、運維團隊的需要,依據管線分色、組件細致度與數據需求表、編碼等方式來建立BIM模型。無論是模型更新、例行性巡檢或是異常通報都是以編碼搜尋或是3D接口查找的方式,查閱相關的設施數據,協助運維者判斷狀況以及需要。業(yè)主、BIM團隊、運維團隊等這些使用...
BIM運維管理——智慧園區(qū)管理應用項目介紹“智慧前灘綜合管理”系統采用了BIM模型作為底層數據庫,導入集成到國際頂級的三維圖形引擎里,能全面展示整個前灘國際商務區(qū)2.83平方公里所建成的市政設施以及各類建筑BIM數字模型,并集成了智慧城市的多項管理系統。