客戶背景
北京電力公司作為國有特大型供電企業(yè),主要負(fù)責(zé)北京地區(qū)的電力供應(yīng)、銷售和輸電、變電、配電設(shè)施的建設(shè),同時承擔(dān)著保障首都安全供電的政治責(zé)任和為北京地區(qū)經(jīng)濟(jì)發(fā)展提供可靠電力供應(yīng)與服務(wù)的使命。北京電力公司以建設(shè)運營北京地區(qū)電網(wǎng)為核心業(yè)務(wù),下轄二級單位34個,其中區(qū)(縣)供電分公司16個。北京電力信息網(wǎng)絡(luò)歷經(jīng)過多次升級改造,目前公司本部機關(guān)局域網(wǎng)設(shè)備以北電設(shè)備為主,局機關(guān)到各二級單位的廣域網(wǎng)鏈路,以思科設(shè)備為主,各二級單位則兼有北電、思科、華為等多個廠家設(shè)備。在前幾期的網(wǎng)絡(luò)建設(shè)中,曾為公司本部配備了HP Openview、CiscoWorks等國外廠商的管理系統(tǒng),可管理到局機關(guān)的大部分局域網(wǎng)和廣域網(wǎng)設(shè)備。
隨著北京電力信息網(wǎng)絡(luò)規(guī)模的不斷擴大,所采用的網(wǎng)絡(luò)技術(shù)日益復(fù)雜、網(wǎng)絡(luò)設(shè)備也日趨多樣化。全公司的各項業(yè)務(wù)系統(tǒng)對計算機網(wǎng)絡(luò)和IT基礎(chǔ)平臺的依賴性越來越高,對于網(wǎng)絡(luò)系統(tǒng)的可用性和穩(wěn)定性提出了更高的要求。原有國外廠商的管理軟件或是局限于對設(shè)備的配置管理,或是缺乏有效的管理手段,致使無法對公司網(wǎng)絡(luò)資源配置及流量分布實施有效管理。同時,由于北京電力已有網(wǎng)管系統(tǒng)僅負(fù)責(zé)局機關(guān)的網(wǎng)絡(luò)監(jiān)控,未能實現(xiàn)對各二級單位網(wǎng)絡(luò)的統(tǒng)一管理,使得北京電力信息中心所面臨的網(wǎng)絡(luò)運維管理壓力,與日劇增。
鑒于北塔網(wǎng)絡(luò)公司擁有多年在國內(nèi)各行各業(yè)IT運維管理實踐的豐富經(jīng)驗,以及北塔咨詢式銷售方法和對于行業(yè)客戶需求的準(zhǔn)確把握,北京電力決定采用基于北塔網(wǎng)絡(luò)公司的北塔網(wǎng)絡(luò)運維管理系統(tǒng)BTNM的市縣二級網(wǎng)絡(luò)運維管理解決方案。
用戶需求
北京電力對此次方案提出了以下幾大需求:
異構(gòu)平臺的全面管理——在北京電力之前的網(wǎng)絡(luò)建設(shè)中,曾經(jīng)為信息中心配備了Cisco Works以及Nortel Device Manager等設(shè)備廠商的管理軟件。由于設(shè)備廠商的管理產(chǎn)品僅限于網(wǎng)元級管理,通用性不強,已遠(yuǎn)遠(yuǎn)不能滿足當(dāng)前基于異構(gòu)平臺的復(fù)雜應(yīng)用環(huán)境的管理需要。“與設(shè)備廠商提供的管理工具相比,我們的網(wǎng)管系統(tǒng)需要進(jìn)一步改進(jìn)。否則用不了多久,多個并存的管理孤島將造成不可想象的后果”,該公司的信息主管表示,“我們再建的網(wǎng)管系統(tǒng),必須要具備強大的跨平臺管理能力,包括設(shè)備平臺、系統(tǒng)平臺和應(yīng)用平臺。”
分支機構(gòu)的統(tǒng)一管理——在2005年,北京電力信息中心將IT運維管理關(guān)注的焦點轉(zhuǎn)向了面向公司本部及眾多下屬單位的管理融合上。當(dāng)時,公司本部和下轄的三十多個二級單位已分別建立起了自身的信息網(wǎng)絡(luò)系統(tǒng),并通過廣域網(wǎng)絡(luò)進(jìn)行互聯(lián)。“過去,我們只是擔(dān)心如何與各下屬單位在網(wǎng)絡(luò)上互聯(lián)互通;今后,我們將更加關(guān)注如何與各下屬單位在管理上互通互融。只有實施全盤的管理,才可能將所有的信息整合到一個統(tǒng)一的、融合的管理平臺當(dāng)中。”
網(wǎng)絡(luò)故障的事前管理——作為承載北京電力各項業(yè)務(wù)系統(tǒng)的IT基礎(chǔ)設(shè)施,網(wǎng)絡(luò)平臺需要面向公司的營銷管理系統(tǒng)、人事管理系統(tǒng)、財務(wù)管理系統(tǒng)、戰(zhàn)略規(guī)劃系統(tǒng)、工程管理系統(tǒng)等各種專業(yè)信息系統(tǒng)提供持續(xù)可靠的網(wǎng)絡(luò)訪問服務(wù)。公司信息中心也非常重視不斷增加的故障隱患和安全威脅(包括蠕蟲、病毒和黑客)對于網(wǎng)絡(luò)平臺穩(wěn)定運行帶來的沖擊。因此,要幫助北京電力實現(xiàn)管理創(chuàng)新的目標(biāo),一個關(guān)鍵因素就是要及時發(fā)現(xiàn)網(wǎng)絡(luò)中的潛在問題和安全隱患,以便提前制止可能的攻擊行為和異常事件,消除病毒和蠕蟲所帶來的系統(tǒng)漏洞和潛在風(fēng)險。
突發(fā)事件的應(yīng)急管理——IT系統(tǒng)面對突發(fā)事件的管理能力體現(xiàn)著管理系統(tǒng)的抗風(fēng)險水平。面對網(wǎng)絡(luò)系統(tǒng)層出不窮的各類突發(fā)性事件,如何進(jìn)行事件的自動通知,如何對告警事件進(jìn)行整合與相關(guān)性分析,自動啟動相應(yīng)的故障恢復(fù)機制和事件聯(lián)動機制,將網(wǎng)絡(luò)故障帶給業(yè)務(wù)系統(tǒng)的損失降到最低程度,是北京電力信息中心的運維工作所面臨的又一大挑戰(zhàn)。
解決方案
為了更好的滿足北京電力對于上下級單位管理融合的需求,保持他們在技術(shù)應(yīng)用方面取得的領(lǐng)先優(yōu)勢,北塔網(wǎng)絡(luò)公司為其提供了一個基于北塔網(wǎng)絡(luò)運維管理系統(tǒng)BTNM(Before Trouble Network Manager)產(chǎn)品的運維管理解決方案,其中包括強大并可擴展的管理基礎(chǔ)平臺、具有集成安全管理的網(wǎng)絡(luò)地址簿、靈活而豐富的報表展現(xiàn)模塊和基于Dataflow/Netflow/Sflow的數(shù)據(jù)流分析模塊。BTNM系統(tǒng)面向本部機關(guān)和各二級單位網(wǎng)絡(luò)的分布式部署與層次化展現(xiàn),幫助北京電力實現(xiàn)了對所有下級單位信息網(wǎng)絡(luò)的統(tǒng)一管理:
面向異構(gòu)平臺的集成化管理
北京電力網(wǎng)絡(luò)運維管理系統(tǒng)的部署,必須面向公司本部和下屬區(qū)縣供電公司的各種交換/路由設(shè)備、網(wǎng)絡(luò)安全設(shè)備、主機/服務(wù)器、環(huán)境監(jiān)控設(shè)備、電源保障設(shè)備以及網(wǎng)絡(luò)流量,實施統(tǒng)一的監(jiān)控與管理。其中,不僅包括思科、北電從低端到高端的十余款網(wǎng)絡(luò)交換機、路由器,Juniper、華為、3COM等多個廠家的網(wǎng)絡(luò)設(shè)備,還涵蓋了Windows / Linux / IBM AIX / HPUX多種操作平臺、SQL
Server / Oracle數(shù)據(jù)庫以及Weblogic中間件等。
BTNM系統(tǒng)在北京電力的部署中,通過全面支持SNMP的v1/v2/v3標(biāo)準(zhǔn),根據(jù)北京電力的管理實際需要,采用多種算法并設(shè)置相應(yīng)的掃描范圍和搜索深度,生成與網(wǎng)絡(luò)情況相吻合的網(wǎng)絡(luò)拓?fù)湟晥D,將所有的被監(jiān)測對象依照連接關(guān)系添加到拓?fù)湟晥D中,從而把異構(gòu)的網(wǎng)絡(luò)平臺納入了統(tǒng)一的管理視角。BTNM產(chǎn)品對于異構(gòu)平臺的管理集成了SNMP get/trap/work/scan、Syslog、SSH、Agent、WMI等多項監(jiān)測手段。對于北京電力某些不支持或不開放SNMP協(xié)議的被管理對象,BTNM提供基于SSH 和Telnet的自定義監(jiān)測方式。BTNM系統(tǒng)可選擇使用SSH和Telnet協(xié)議登錄到被管理網(wǎng)元,自動下發(fā)和執(zhí)行預(yù)置的命令腳本,并接收腳本返回的數(shù)據(jù)信息,大大擴展了對于異構(gòu)平臺的監(jiān)測范圍和類型。
BTNM面向異構(gòu)平臺的集成化管理,高效集成了傳統(tǒng)的網(wǎng)絡(luò)管理、系統(tǒng)管理和應(yīng)用管理,提供覆蓋各種網(wǎng)絡(luò)設(shè)備、主機服務(wù)器、數(shù)據(jù)庫、中間件、通用軟件、專有設(shè)備及專有業(yè)務(wù)系統(tǒng)的各種監(jiān)測器。BTNM系統(tǒng)通過將不同類型的監(jiān)測器獲得的管理數(shù)據(jù)進(jìn)行多角度多層面的綜合分析,匯總出企業(yè)關(guān)心的信息網(wǎng)絡(luò)整體運行狀況視圖,從而更好的幫助信息中心全面了解和預(yù)測企業(yè)當(dāng)前的IT運行環(huán)境。
面向分支機構(gòu)的層次化管理
在幫助北京電力建設(shè)面向全局的運維管理體系中,不僅要優(yōu)化本部機關(guān)園區(qū)網(wǎng)絡(luò)的管理,更要考慮到全市各區(qū)縣下屬單位為數(shù)眾多廣域節(jié)點的管理。在這種情況下,采用傳統(tǒng)的平面型網(wǎng)管結(jié)構(gòu)無疑會使得SNMP管理器成為性能瓶頸;過多過頻的輪詢和分布愈來愈廣的代理,不僅會加重廣域鏈路管理帶寬的整體開銷,又要耗費掉運行SNMP管理器計算機的大量處理時間,致使網(wǎng)絡(luò)管理效率全面下降。
北塔網(wǎng)絡(luò)運維管理解決方案充分考慮到平面型管理結(jié)構(gòu)的弊端,而在北京電力各區(qū)縣下屬單位部署了中間層管理器。通過BTNM產(chǎn)品的分布式部署,實現(xiàn)了全公司信息網(wǎng)絡(luò)的層次化管理結(jié)構(gòu)。BTNM的層次化管理結(jié)構(gòu)可使各下屬單位信息網(wǎng)絡(luò)的數(shù)據(jù)采集和運維管理均在本地完成,經(jīng)過各個中間層管理器匯總后的拓樸數(shù)據(jù)、事件信息和性能數(shù)據(jù)統(tǒng)一上傳到為于機關(guān)本部的中心網(wǎng)絡(luò)平臺。
通過BTNM產(chǎn)品的層次化管理,不僅為各區(qū)縣級單位配備了功能強大的運維管理平臺,并進(jìn)一步擴展了本部機關(guān)的管理范疇。信息中心的管理人員可在機關(guān)本部直接調(diào)閱下屬單位的網(wǎng)絡(luò)拓?fù)湟晥D,隨時了解各區(qū)縣網(wǎng)絡(luò)的運行狀況。在這一架構(gòu)下,區(qū)縣網(wǎng)絡(luò)系統(tǒng)的重要事件告警可在第一時間直達(dá)本部網(wǎng)管中心,而當(dāng)各下屬單位網(wǎng)絡(luò)發(fā)生故障時,市信息中心還可通過中心平臺遠(yuǎn)程幫助排查問題,解決故障,提升了全公司的運維管理水平。
面向網(wǎng)絡(luò)故障的事前管理
網(wǎng)絡(luò)事前管理作為BTNM產(chǎn)品的核心理念,在此次的北京電力網(wǎng)絡(luò)運維管理系統(tǒng)的部署中得到了更加客戶化的展示。由于在管理人員日常的維護(hù)工作中,很難預(yù)期未來故障的爆發(fā)時間和具體位置,往往造成了在網(wǎng)絡(luò)出事之后匆忙救火、疲于應(yīng)對的被動局面。
北塔的BTNM系統(tǒng)將北京電力信息網(wǎng)絡(luò)的各個管理對象(路由器、交換機、服務(wù)器、防火墻、主機、網(wǎng)絡(luò)鏈路等) 視為網(wǎng)絡(luò)健康的“傳感器”,通過監(jiān)視這些感應(yīng)器的運行狀態(tài)和性能參數(shù)(如CPU、MEM、流量負(fù)載等) 的變化情況
,并將其動態(tài)投影為拓樸視圖中相應(yīng)的顏色變化,便于管理員一目了然的掌控整個網(wǎng)絡(luò)的實時運行狀態(tài)。當(dāng)某項監(jiān)測參數(shù)發(fā)生異常時,系統(tǒng)可使用醒目的顏色和直觀的狀態(tài)圖標(biāo)提醒管理人員進(jìn)行關(guān)注,配合系統(tǒng)提供的網(wǎng)絡(luò)設(shè)備性能分析、地址定位等功能來提前進(jìn)行異常事件診斷,從而達(dá)到了防患于未然的目的。
北京電力在BTNM管理平臺的基礎(chǔ)上,進(jìn)一部規(guī)范管理流程,實現(xiàn)了網(wǎng)絡(luò)運維從“事后堵漏式補救”向“事前主動式管理”模式的轉(zhuǎn)變,信息中心的管理壓力也得到了有效緩解。
面向突發(fā)事件的告警管理
故障告警管理是網(wǎng)絡(luò)運維管理系統(tǒng)的核心,告警信息的及時與準(zhǔn)確是網(wǎng)管系統(tǒng)能否夠發(fā)揮應(yīng)有作用的重要保證。BTNM系統(tǒng)能夠?qū)?span
lang=EN-US>IT網(wǎng)絡(luò)及系統(tǒng)的各類突發(fā)事件產(chǎn)生的事件信息和告警信息進(jìn)行整合和自動化處理。利用Syslog接收器獲取相關(guān)設(shè)備轉(zhuǎn)發(fā)的Syslog信息,利用SNMP Trap接收器獲取設(shè)備或第三方管理工具的事件告警信息,并可實現(xiàn)基于策略的事件過濾和相關(guān)性分析。
BTNM系統(tǒng)提供豐富的告警類型,涵蓋網(wǎng)絡(luò)告警、管理告警、主機監(jiān)視、應(yīng)用監(jiān)視、流量監(jiān)控多個層面。對于各類突發(fā)事件,系統(tǒng)可采用靈活多樣的告警方式及時通知信息中心管理人員,包括中文語音報讀、控制臺彈出消息、E-Mail、SMS、Windows信使多種方式,實現(xiàn)了全天候的事件自動通知。同時,通過BTNM內(nèi)置的事件處理機制,配合管理員預(yù)置的事件聯(lián)動措施,可實現(xiàn)對于告警的自動診斷與快速恢復(fù),有效的增強了北京電力應(yīng)對網(wǎng)絡(luò)突發(fā)事件的處置能力。
實施效果反饋
北塔網(wǎng)絡(luò)公司所提供的BTNM系統(tǒng)是集網(wǎng)絡(luò)平臺管理、數(shù)據(jù)流量分析和應(yīng)用服務(wù)系統(tǒng)監(jiān)控于一體的綜合運維管理系統(tǒng),一體化的平臺架構(gòu)符合新一代IT綜合管理的趨勢。在BTNM產(chǎn)品的解決方案中,提供了面向北京電力本部和各下屬單位的整體管理視圖。BTNM以網(wǎng)絡(luò)平臺為基礎(chǔ),將網(wǎng)絡(luò)管理、系統(tǒng)管理、應(yīng)用管理三方面的運行趨勢統(tǒng)一映射為全公司信息網(wǎng)絡(luò)的健康性和可用性。通過BTNM系統(tǒng)的全面部署,不僅實現(xiàn)了北京電力的管理目標(biāo),在提升信息中心管理效率的同時,充分保證了北京電力IT系統(tǒng)的可用性及可靠性,并可隨北京電力業(yè)務(wù)系統(tǒng)的發(fā)展而擴展。
隨著北京電力公司調(diào)度、營銷、市場各項業(yè)務(wù)的廣泛地開展,BTNM產(chǎn)品當(dāng)前所支持的網(wǎng)絡(luò)系統(tǒng)管理模式,在今后可方便地擴展到面向服務(wù)的服務(wù)流程管理和服務(wù)級別管理,較好的滿足了北京電力近期和遠(yuǎn)期的系統(tǒng)管理目標(biāo)。