了解最新公司動態(tài)及行業(yè)資訊
背景與挑戰(zhàn)
隨著電網企業(yè)數(shù)字化轉型的推進,以及云平臺、大數(shù)據、物聯(lián)網、移動化、智能化等新技術的應用,加快高效一體化的網絡故障排查定位和深度推動人工智能和大數(shù)據技術在電網信息系統(tǒng)運維中的應用,以及利用前沿技術提高生產管理效益,提升數(shù)據在數(shù)字化電網過程中的價值建設已成為電網企業(yè)數(shù)字化轉型的必然要求。
同時,隨著電力行業(yè)數(shù)字化轉型的不斷發(fā)展,相關企業(yè)業(yè)務系統(tǒng)的不斷更新和設備數(shù)量的銳減,導致電力行業(yè)存在以下痛點:
基于以上背景和痛點,如何在不植入探針或代理的情況下監(jiān)控業(yè)務環(huán)節(jié)的運行情況,業(yè)務管理者如何統(tǒng)計分析關鍵業(yè)務指標數(shù)據,運維人員如何準確定位故障排除故障這對電力行業(yè)相關企業(yè)來說是一個巨大的挑戰(zhàn)。
場景需求分析
基于以上背景和挑戰(zhàn)分析,電力行業(yè)具體包括以下運維場景要求:
解決方案的整體產品技術框架
右圖為整體產品技術架構,包括底層三維監(jiān)控管理工具集、中層數(shù)字化運維數(shù)據中心、頂層數(shù)據價值與管理產品放。底層的三維監(jiān)控管理工具集包括基礎設施監(jiān)控(DOIM)、業(yè)務績效監(jiān)控(DBPC)等開源和非開源監(jiān)控工具和日志分析(DOLA);中層數(shù)字運維數(shù)據中心包括數(shù)字運維指標管理系統(tǒng)(DOMM)、面向服務的配置管理(CMDB)、智能分析(DOIA)、數(shù)字運維數(shù)據庫(DODB)和采控平臺(DOCC);頂層數(shù)據價值和管理產品集包括數(shù)字化運維監(jiān)控中心(DOMC)、數(shù)字化運維管理(DOEM)數(shù)字化運維工作臺、報表和數(shù)字化運營服務管理。
產品列表和功能業(yè)務績效監(jiān)控工具
右圖為服務性能監(jiān)控工具監(jiān)控網絡流量鏡像的具體流程。通過捕獲網絡鏡像流量來分析業(yè)務數(shù)據。服務啟動后,通過多層鏈接將服務流量綜合展示,直觀清晰地展示了該層服務所消耗的時間。
數(shù)字化運維數(shù)據庫
只有數(shù)字化運維數(shù)據庫才能實時高效地訪問用戶環(huán)境的各種數(shù)據源it運維技術it運維技術,收集用戶環(huán)境中的IT和業(yè)務數(shù)據,統(tǒng)一管理和存儲,使用便捷強大的建模和分析工具,將數(shù)據轉換為執(zhí)行關聯(lián)分析、業(yè)務建模,并將結果實時輸出到可視化和其他應用程序。
數(shù)字化運維算法平臺
數(shù)字化運維算法平臺包含指標異常檢測、指標預測、日志模式識別、根因分析推薦、多指標分析、告警降噪等六大AIOps場景20余種智能算法。提供豐富的算法庫,開箱即用,支持豐富的運維場景。
數(shù)字化運營指標系統(tǒng)管理平臺
數(shù)字化運營指標體系管理平臺作為下層應用端產品監(jiān)控中心的重要數(shù)據源之一,通過整合業(yè)務和IT資源、指標,幫助其圍繞業(yè)務價值建立多維度的運維監(jiān)控、健康、告警風暴系統(tǒng),以實現(xiàn)對故障的快速檢測、分析和定位能力,實現(xiàn)全方位、立體化監(jiān)控。
靜態(tài)閾值
動態(tài)閾值
健康設置
當生死線指標嚴重異常時,可以一票確定健康度。健康評分是受試者健康狀況的極佳指標。
數(shù)字化運維監(jiān)控中心
數(shù)字化運維監(jiān)控中心是一個全方位、立體的實時監(jiān)控產品。面向企業(yè)業(yè)務價值和IT運維頂層規(guī)劃。統(tǒng)一監(jiān)控IT資源,建立業(yè)務關聯(lián),結合指標、日志、告警等,幫助快速檢測、分析、定位故障。
數(shù)字化運維風暴管理
數(shù)字化運維風暴管理基于大數(shù)據技術和機器學習算法,統(tǒng)一接入和處理來自各個監(jiān)控系統(tǒng)的告警消息和數(shù)據指標,支持告警風暴過濾、通知、響應、處置、分類、跟蹤多維度分析,最終實現(xiàn)告警風暴全生命周期的閉環(huán)管控。
整體程序流程
在數(shù)據采集端,通過服務性能監(jiān)控工具捕獲旁路流量,獲取業(yè)務系統(tǒng)的監(jiān)控數(shù)據。同時通過梳理業(yè)務流程構建業(yè)務鏈路拓撲,實現(xiàn)基于實際業(yè)務鏈路的監(jiān)控分析。監(jiān)控數(shù)據通過Kafka傳遞到運維數(shù)據庫。
運維庫收到數(shù)據后,對數(shù)據進行處理(包括數(shù)組提取、拆分、合并、格式轉換等),根據場景需求將不同的數(shù)據存儲在不同的數(shù)據庫中,通過查詢引擎。數(shù)據支持。
最后將業(yè)務系統(tǒng)拓撲和數(shù)據指標統(tǒng)一展示在監(jiān)控中心,基于規(guī)則進行健康分析和風暴告警,并通過智能運維算法和大數(shù)據分析,進行趨勢預測實現(xiàn)指標數(shù)據的采集和風暴告警的檢測。根本原因分析。
某電網企業(yè)案例分享需求分析云智能解決方案開源收益
云智慧有一個開源的數(shù)據可視化編排平臺。通過配置數(shù)據模型,為用戶提供數(shù)百個可視化圖形組件,零編碼即可實現(xiàn)滿足自身業(yè)務需求的炫目可視化大屏。同時,飛魚還提供靈活的擴展能力,支持組件開發(fā)、自定義功能、全局風暴等配置,能夠保證復雜需求場景的高效開發(fā)和交付。
點擊下方地址鏈接,歡迎點贊,送星。參與組件開發(fā),一億多現(xiàn)金等著你。
地址:
Gitee地址:
陌陌掃描下方二維碼識別,備注【飛魚】加入AIOps社區(qū)飛魚開發(fā)者交流群,與項目PMC面對面交流~