盡管IT運維管理的技術在不斷進步,但實際上,很多系統工程師并沒有真正解脫出來,原因并不復雜:“雖然已經能夠獲取網絡設備、服務器、網絡流量,甚至數據庫的警告信息,但成千條警告信息堆積在一起更本沒法判斷問題的根源在哪里?”“雖然不少產品提供了告警過濾和壓縮,但結果卻并不盡人意”。面對這樣的抱怨,難道我們的工程師將永遠無法走出“被動的怪圈”嗎? 如今,在IT運維領域中,“主動”并不是一個新鮮的概念。幾乎所有的宣傳、產品、用戶、理念都在宣揚“主動”,從被動到主動管理的升華是每個企業針對信息系統如何提高IT服務水平、如何提高系統可用性、降低運維成本,實現IT科學性的過程。很多企業在選擇IT管理工具時將最終目標就定位在“主動”,希望業務系統能夠“無憂”,但真正能夠達成IT與業務融合的企業卻是很少。很多IT運維廠商都強調,“傳統被動式”的類似“救火員”角色的IT系統運維方式,根本不能適應目前需求,那么企業到底怎樣才能實現真正的“主動”呢?
為何喪失了“主動”的先機?
在虛擬化、云計算等新興技術的刺激下,IT正在走向一種整合的發展趨勢。當然,這種整合并不局限于幾臺服務器的集群或組成1個數據中心,而是更多地指向了有序、有效地集中,但也就會導致原有的問題也會集中在一起。中國的IT工程師習慣于將工作重心放在性能而不是質量上,放在提供支持而不是消除問題上。
就如我們共知的那樣,IT問題的發生是必然的,但未能根據業務進行基礎監控的用戶,將喪失在問題造成業務中斷之前,就進行防止的契機,也就喪失了“主動”的條件。
“主動”怎樣落到實處?
IT技術正在成為企業的神經中樞,越來越多的企業希望借助IT技術這一關鍵的戰略資源提供對關鍵業務的支持,提升公司的競爭優勢,進而實現公司的戰略目標。然而由于今天的IT組織面臨著諸如日益增長的基礎設施復雜性、技能方面的限制以及資金短缺等相當多的問題,因此要實現這一點并不容易。
就如前面說明的那樣,如果在IT系統中沒有出現問題,也就沒有告警信息,但這是不可能存在的一種假設。當所有的業務系統集中起來的時候,出現無數的警告信息實際上是非常正常的,這就如人生病一樣,很多疾病都會造成身體上多處特征的不良反應,醫生會開出多得讓你厭惡的檢查表格讓你檢查,實際上這就是瞧病過程中找到病源的過程。但這個過程越長,你就越加無法忍受。企業的業務系統也是如此,在問題出現時,不能將問題迅速歸類,不能發現最具特征的表象,也就遲遲無法做出問題改善,“主動”也就失去了意義。
脫離每天被繁冗的警告和報表所包圍的現狀,利用“主動管理”高效而清晰地描述業務系統的運行狀況,立即把所有的警告信息繁為簡,一目了然。IT 部門必須能夠提供追蹤問題改善狀況的評估方式,以便達成持續的改進成果,這才是“主動”的內涵。
當你迅速地解決系統故障,端起一杯咖啡時,那溫暖的愜意,也許正是IT運維中關于“主動管理”一詞最直接、最具說服力的解釋。 |