現狀與痛點
為了滿足數據中心大規模運營管理的需求,我國眾多企業開始構建專業的監控平台。這些平台能夠對主機和網絡等關鍵數據進行集中展示。然而,仍有一些問題尚未解決,例如,無法對業務應用交易進行監控,難以準確掌握業務係統的運行狀況,不能自動識別應用拓撲結構或定位故障點,而且也無法將IT事件與交易事件關聯起來進行分析。
傳統監控短板
傳統監控多集中於基礎部分,卻未能對業務應用和交易過程進行全方位監控。比如,它無法全麵、迅速地收集交易量、成功率等關鍵數據。此外,它對應用係統間的結構關係和交易訪問路徑也不甚了解,這使得在係統出現故障時難以迅速定位問題所在,進而影響了運維的效率和品質。
APM 模型參考
根據 Gartner 的應用性能監控模型,設計 IT 運維監控係統需從五個方麵入手。此模型為監控提供了方法論,有助於提高監控的水平和效果。盡管某些方案可能對服務器性能產生一定影響,但它們能夠靈活地統計交易數據,具備一定的實用性和適用性。
自動定位故障
通過比較交易路線或應用拓撲圖上的指標變動,蜜桃视频网站WWW能夠將故障精確地鎖定在某個具體的應用係統或APP服務器上。借助前兩個維度的交易指標進行監控,大多數故障都能被定位到特定的APP服務器節點。這種自動化的定位方式有助於快速解決問題,降低故障帶來的影響。
數據智能處理
在執行交易監控過程中,係統會通過關聯信息自動識別應用節點的訪問關係及交易路徑等配置信息。同時,它還能自動識別並優化IT組件的特性及其訪問關係。這些業務數據被保存在IT運維數據處理平台上,該平台還具備自動可視化展示關聯和訪問關係的功能。
事件關聯分析
企業試圖通過大數據分析探索專業事件間的聯係,或者根據規則將事件聯係起來。在建立聯係的過程中,係統會根據指標的相互依賴性自動構建故障樹。通過建立聯係和生成故障樹,將各個專業的監控係統整合起來,可以有效提升IT故障處理的效率和品質。
你認為這些針對IT運維監控係統的改進措施中,哪一項能最迅速提高企業的運維效能?歡迎點個讚,把這篇文章轉發出去,同時也期待聽聽你的觀點!