案 例 簡 介
安徽移動經過幾年的信息化建設,已經建成了統一信息平臺Portal、OA、MIS等多個應用系統。企業各個業務所需要的應用系統,極大地提升了企業的信息化水平,提高了工作效率,基本實現了無紙化辦公。隨著應用系統越來越多、越來越深入,員工的日常工作已離不開這些應用系統,應用系統的運行狀況直接影響著員工辦公、企業生產,因此確保應用系統的安全、可靠、穩定地運行成為系統維護部門越來越重要的問題,尤其是員工日常辦公必需的OA系統。目前安徽移動的OA系統已經運行三年時間,采用Lotus Domino平臺,供全省5000名員工辦公使用。在OA系統維護工作中存在著如下問題: ·系統需要人工監控,維護量巨大,并且無法一一監控到位,同時不能做到持續地實時監控。 ·忙于應對已發生的故障,被動響應式的工作方式,解決故障的效率低。 ·Lotus Domino無故宕機,很難及時發現和預見問題的發生。 ·問題出現后,很難快速、準確地找到根本原因。 ·問題找到后,缺乏流程化的故障處理機制。 ·支持過程總是被打斷和干擾。 ·缺乏過程和變化的跟蹤記錄,如系統運行狀況、主機配置變化、應用模塊變更等。 ·不能及時地統計、分析系統狀況,供領導決策。結果造成維護部門在出現問題時疲于應付、導致維護工作的滿意度較低,這些問題一直困擾著IT維護部門。維護部門迫切的希望改變目前的這種狀況。為了解決以上一系列問題,真正實現IT服務全過程一體化,包括管理、監控、統計分析等,并通過組織、流程和制度的完善以及相應的技術設施的建設來支撐和保障IT部門的整體服務水平,我們為安徽移動用戶提供了基于Mocha BSM產品的應用監控解決方案。
用 戶 名 稱
安徽移動通信有限責任公司
用 戶 類 型
電信
用 戶 簡 介
安徽移動通信有限責任公司是中國移動(香港)有限公司全資子公司。安徽移動于2002年7月1日在香港及海外上市,企業性質為外資企業。公司下屬17個市級分支機構、61個縣級分支機構。公司經營范圍是在安徽省經營移動通信業務,包括話音、數據、多媒體等。如: IP電話及互聯網接入服務。從事移動通信、IP電話和互聯網等網絡的設計、投資和建設。移動通信、IP電話和互聯網等設施的安裝、工程施工和維修。經營與移動通信、IP電話和互聯網業務相關的系統集成、漫游結算清算、技術開發、技術服務、廣告業務、設備銷售等。出售、出租移動電話終端設備、IP電話設備、互聯網設備及其零配件,并提供售后服務。
用 戶 需 求
·實時監控主機、Lotus Domino平臺、OA應用、郵件應用等基礎設施、應用等IT資源的運行狀態、性能和可用性。
·當監測到系統故障時,快速定位故障的主要原因,估算系統事件對業務的影響及其嚴重程度,并觸發相應的故障處理流程。
·故障處理流程通過整合OA系統來實現,以短信提醒、待辦待閱的報警形式實現系統流程的自動化。
·簡單操作的系統管理配置,方便地配置所監控服務器的信息,應用數據自動獲取。
·系統將根據服務級別協議(SLA),為客戶方便地定義符合其需要的各種指標閾值,通過具體的數字來量化地評價服務響應速度、故障修復時間等IT服務水平。
·通過門戶系統可以進行統一整合,實現單點登錄SSO、統一授權和訪問控制、集成展現和個性化等功能,使系統各模塊之間實現無縫的協同工作,給IT服務經理、系統管理員、應用管理員等不同的用戶群體和角色提供了可視化的工作平臺。
·提供了豐富的報表,提供了統計報告,提供了資源或指標走勢,用以輔助分析和決策。
技 術 路 線
產品概述
摩卡業務服務管理(Mocha Business Service Management),簡稱Mocha BSM,整合了系統管理、監控、工作流、統計分析和門戶等多種技術,是對ITIL的IT服務管理核心流程的實現,是一個實用、可擴展的技術解決方案。
Mocha BSM Lotus Domino應用監控是一個專門針對Lotus Domino系統提供監控、故障定位、統計報告等功能的組件。
該產品主要具有以下功能:
·提供面向“服務”的,整合網絡、主機、應用、服務等各層面IT資源的、統一的IT服務管理信息視圖。
·實時監控OA系統的運行狀態,及時發現問題。
·告知事件對企業影響的嚴重程度。
·準確、快速地定位故障產生的根本原因。
·根據嚴重程度和優先級別,觸發相應的處理流程。
·提供統計報告和分析圖表,為領導層提供決策依據。
功能描述
安徽移動OA應用監控系統是基于Mocha BSM產品,該產品為安徽移動提供了統一的、集中的IT服務管理平臺。系統包括系統監控和報表展現、決策分析等主要功能。
系統監控功能
通過對OA系統的主機、平臺、應用等方面的監控,實現了對OA系統在性能上、可用性上全方面的跟蹤,能夠及時發現故障、確定故障影響嚴重性并能定位故障根本原因。
主機信息監控:提供對OA系統所在服務器進行實時監控。
平臺信息監控:監控Lotus Domino平臺指標信息直接決定提供服務的性能,從根源上管理平臺可用性。
應用信息監控:多年經驗匯聚提取OA應用層面重要指標,預防為主。
主機方面
監控運行于省公司、地市分公司的OA應用、郵件應用的六臺UNIX主機,包括CPU、內存、硬盤、OS文件系統等運行狀況的重要指標。
監控時間頻度為5分鐘采集1次(監控時間頻度可以自行配置)。
平臺方面
包括運行于省公司、地市分公司的OA應用、郵件應用的十二個Lotus Domino分區服務。Lotus Domino平臺監控的指標主要包括:
應用平臺
-AMGR(TASK)狀態
-Lotus Domino Server狀態
-HA切換狀態
-HTTP(TASK)狀態
-HTTP活動線程數
-HTTP響應時間
-Web代理設置狀態
-超時信號燈狀態
-丟棄的會話數
-服務器1352端口狀態
-個人Internet地址狀態
-日志庫Corruption信息
-用戶Session
-宕機情況
郵件平臺
-POP3(TASK)狀態
-Router(TASK)狀態
-SMTP(TASK)狀態
-等待郵件數目
-死信數目
監控時間頻度:對于部分監控頻度要求較高的指標為5分鐘采集1次、對于部分監控頻度要求較低的指標1天采集1次(監控時間頻度可以自行配置)。
應用方面
包括省公司、地市分公司在內的OA應用、郵件應用的監控:
·OA應用:包括省公司及全省十七個地市的共十八套OA應用系統,分布在四臺服務器上。
·郵件應用:包括全省5000用戶的使用的郵件系統,分布在兩臺服務器上。
應用監控的指標主要包括:
-定時代理激活狀態
-數據庫存取控制Anonymous狀態
-數據庫大小
-數據庫是否損壞
-數據庫視圖文檔量
-數據庫索引大小
-數據庫文檔量
-數據庫增長率
-文檔文本域值大小
監控時間頻度:對于部分監控頻度要求較高的指標為5分鐘采集1次、對于部分監控頻度要求較低的指標1天采集1次(監控時間頻度可以自行配置)。
系統監控的其它功能點
·對于性能指標超標、宕機故障,通過手機短信、郵件直接發送給OA系統的管理員、維護人員及其他相關人員,在報警信息中明確哪臺主機、哪個Lotus Domino分區、哪個地市的應用、故障發生的時間、初步定位的故障原因等重要信息,方便維護人員了解故障并及時解決故障。
·實現了Mocha BSM系統跟OA系統集成。對于Mocha BSM中的預警、故障會直接觸發OA系統中的預警流程、故障處理流程,這些流程會自動推送到OA系統相關人員的待辦、待閱任務列表中。
·Mocha BSM對OA系統的主機、平臺、應用等各方面的過程和變化進行全面的跟蹤記錄,如系統運行狀況、主機配置變化、Lotus Domino平臺配置變化、應用模塊變更等都會自動記錄到系統中,非常方便查閱這些動態信息,做到了可追溯,同時這也符合SOX法案的要求。
報表展現、決策分析功能
Mocha BSM系統對監控主機、平臺、應用等方面收集到的數據提供了各種直觀形象的圖表和報表展現,提供了統計報告,提供了資源或指標走勢,用以輔助分析和決策。
通過Mocha BSM提供的查詢、統計功能、分析功能,安徽移動客戶可以統計1個月以來發生的故障次數以及解決故障的時間等等,作為提高維護質量的基礎數據。
Mocha BSM能夠根據歷史數據對未來趨勢進行預測,使決策更有依據。例如,能夠根據磁盤每天的增長率來預測磁盤擴容的時間點,提前向管理員提示,為主機擴容提供依據,同時避免了人為的檢查疏漏而磁盤空間達到臨近100%產生的風險。
技術架構
Mocha BSM系統設計中采用分層設計的方法,將整個系統劃分為用戶層、展現層、應用邏輯層、監控層、IT資源層。

過 程
在本期工程中主要針對OA系統相關的主機、Lotus Domino平臺、OA應用、郵件應用、工單應用等進行管理、監控、分析。由于OA系統涉及到全省員工的日常辦公,為了降低風險,實施過程分以下幾個階段進行:
試點
首先選擇銅陵地市分公司的OA應用、Mail應用進行試點,在該分公司的OA應用、Mail應用中部署Mocha BSM系統進行試運行,在功能、穩定性等方面進行考察。監控銅陵分公司的OA系統穩定運行1個月,在監控主機方面、平臺方面、應用方面都獲得了比較好的運行情況。在試點期間,安徽移動用戶根據試點情況,對Mocha BSM進行了全面的測試、對一些配置參數進行了調整,對部分功能進行了細化。經過1個月的試點,Mocha BSM滿足了推廣條件,正式封版,準備全面推廣。
推廣
事先制定周密的推廣方案、詳細的工作計劃、切實可行的實施步驟、全面的技術支持與服務。推廣期間還分別對實施人員、維護人員、管理員等進行了培訓。經過充分的試點工作、培訓工作后僅用2周時間便成功地將Mocha BSM系統推廣到省公司及其它地市分公司的OA應用、Mail應用、工單應用中,目前系統均運行良好。
成 果
目前Mocha BSM系統已經在安徽移動正式上線使用且運行穩定。通過Mocha BSM對OA系統的監控、管理,徹底改變了IT部門維護OA系統的工作方式、解決了IT部門之前面臨的種種問題。通過Mocha BSM的實施和使用:
·從被動響應式的工作方式轉變為主動服務。
·OA系統維護的滿意度不斷提高。
·通過自動的資源監控系統及時發現問題,避免重大故障發生。
·問題出現后能夠協助管理員快速找到問題原因,并及時地觸發故障處理流程。
·自動化的流程推送和提醒功能,在多任務工作環境下得心應手。
·分析數據,展現報表,使公司領導更及時了解到相關信息。
·使人員分工、IT預算等決策更有依據。
其 他
運行環境
安徽移動OA應用監控系統部署:
·兩臺Windows 2000 PC Server服務器:1臺為應用服務器,運行Mocha Portal應用服務器,部署Mocha BSM,另1臺為數據庫服務器,存儲Mocha BSM的監控數據。
·在被監控的6臺OA系統UNIX主機上分別部署Mocha BSM的代理程序,代理程序負責監控系統、獲取各項數據。
·用戶端
·操作系統:Windows 2000、Windows XP、Windows 2003
·硬件配置:CPU主頻200MHz以上、內存128M以上、硬盤300M以上
·瀏覽器:IE 6.0以上
·軟件產品
·Lotus Domino Client
·Oracle 9i Database
·Oracle Client
·Mocha Business Service Management
·Mocha Remote Agent Management
·Mocha Alert |