如何建立一套適合的運維體系關系著信創應用運行的好壞和運維的后續保障,傳統的運維體系雖然在框架和方法上可以參照,但在具體運維方面上仍存在著一定的區別。本文以辦公管理系統信創應用改造的過程為例,結合信創運維體系存在的差異和風險進行綜合分析。
隨著我國信息技術產業的快速發展,信息技術創新能力大幅提升,產業結構優化升級取得實質進展,呈現出整體產業由弱向強轉變的趨勢,當前已經具備信創應用推廣和發展基礎。同時作為數字“新基建”的重要組成部分,伴隨國產化、信創化趨勢浪潮的不斷推進,信創技術和方案逐漸發展成熟和實踐落地,推動著整體產業朝數字化轉型和國產自主可控的方向穩步前行,越來越成為經濟社會發展的核心驅動力。
對于信創方案落地的實現方式而言,不是簡單和盲目的國產化替換,也不是對國外產品和架構的粗暴否定,而是在不犧牲性能和穩定的前提下,伴隨信創技術的成熟和積累,有目的、有計劃的逐步逐次實現有效嘗試和替換。
對于信息系統而言,業務的連續性和運行的穩定性關系著信息系統服務質量的好壞,而連續性和穩定性則是需要靠運維來支撐和保障,因此一套良好且適合的運維體系則是信息系統運行的方向指引和保障基礎。而信創信息系統的運維體系相比傳統的運維體系,就本質和內在而言存在著一定的區別。
以辦公管理系統應用信創改造為例,該系統信創目標為實現辦公管理系統在服務器、操作系統、數據庫、中間件、OA系統、電子簽章等軟件、終端的全棧式國產化建設。在滿足國產化要求的基礎上實現辦公管理系統新建和歷史數據的遷移,最終完成該系統的全棧信創改造。而改造的落地方式分為可行性分析、選型、技術驗證、方案設計、應用適配改造及測試、試點運行、項目遷移等幾個階段。
1)可行性分析:即對系統進行信創技術分析,編寫信創實施方案,確認項目計劃;
2)選型:與市場主流的信創芯片服務器、操作系統、軟件、終端等廠商進行交流、初步確認候選范圍;
3)技術驗證:實現應用適配改造論證、驗證測試,并確認信創產品選用方案;
4)方案設計:即完成項目整體的方案設計并進行評審;
5)應用適配改造及測試:即對應用進行適配開發改造、驗證測試等工作;
6)試點運行:將開發及測試完成的應用在信創環境上進行試點運行及試點跟蹤;
7)項目遷移:待試點運行成熟后,將該應用切換為雙軌運行并總結項目經驗,完成項目驗收。
該系統的部署架構圖如圖1所示。
圖1應用信創改造部署架構圖
由于該系統是全棧的信創改造,涉及到國芯服務器和交換機、國產存儲設備、操作系統、中間件、數據庫和安全軟件等,產品種類較多,范圍較廣,運維難度較大。因此對于信創應用的運維來說,如何建立一套適合的運維體系關系著信創應用運行的好壞和運維的后續保障。相比于傳統的運維體系而言,雖然在框架和方法上可以完全參照,但在具體運維方面上仍存在著一定的區別,如果完全復制傳統運維體系,則存在著無效管理、處置速度慢、運維體系缺失等問題。基于此現就信創應用運維體系的相應變化進行簡要說明。
1)運維技術和團隊方面
因信創改造涉及到各類軟硬件的國產化替代,部分產品還未在國內大規模普及,運維人員對于以上軟硬件產品及相應技術的技能儲備有限,對產品、技術特性了解不夠充分,對國內自主產品體系尚未完全適應。而相比傳統運維所用的技術已比較成熟,運維團隊人員配備也較充足,運維人員技術掌握度也較高。
2)運維監控方面
傳統運維對相應應用的監控指標和維度已日趨穩定,相應的監控和處置體系也較成熟,而信創應用運維監控體系仍在起步和發展階段,需隨著信創產品特性不斷完善,以及在應用持續運行過程中持續調整和優化。
3)運維基線方面
相比于傳統運維在運維基線方面比較成熟和明確,信創運維基線仍處在起步階段,相應的操作系統和軟件等還未明確相應的基線。
4)容災備份方面
目前傳統應用在容災和備份方面采用的產品和解決方案大都為國外產品,如HADR、SRM及NBU等,產品功能強大且運行穩定,而全棧信創在容災備份方面需同國產容災備份產品進行相應的適配和驗證。
5)應急處置方面
傳統應用在應急處置方面,處置方案及文檔齊全且進行多次的演練和驗證,在應急處置方面較為成熟,而對于信創應用而言應急處置方案有些尚未體系化,演練缺失,缺乏有效的應急處置經驗。
當然這是由于信創產業在當前特殊背景下產生的一定問題,就信創運維體系而言還存在著如下風險:
1)技術風險
當前整個信創環境如操作系統、CPU等硬件、數據庫、中間件等既相互協作又相互影響和制約,而當前信創處于一個快速發展階段,因此在實際環境中就形成了一個個相對獨立的孤島,硬件不同、操作系統版本不同、應用軟件千差萬別,這就對技術路線選型提出了很高的要求,既要向前兼容也需要向后兼容,否則產品的實施成本和維護成本就會急劇增大。
2)運維風險
國產化產品多為各廠商自研或基于開源平臺封裝,同時各產品還未在國內大規模普及,因此對產品的熟悉程度還存在欠缺,對專業技術人員的培養還存在差距。因此當系統或產品發故障時,能否進行故障的快速定位、處理,能否對業務進行快速恢復,減少業務損失成為一大風險點。
3)開源風險
信創產品生態非常龐大,能夠完全不依賴第三方開源代碼的公司非常少,為了提高運維效率,大量使用第三方開源代碼,無形之中給整個信創生態體系埋下隱患,一是違反開源協議產生侵權行為,面臨巨額罰款或者是停止侵權行為;二是有很多開源軟件具有故意留下的后門,存在巨大的安全漏洞而造成敏感信息的泄露或者是被操縱。
結合信創應用以上存在的變化及風險,就信創應用帶來的運維變化而言,我們應對的方案如下:
1)建立信創運維體系。結合ITSS和ITIL的要求,建立標準的信創應用運維管理體系,形成完善的運維管理制度,同時結合國產化產品的特性,形成專有的運維管理體系,以保障信創相關應用的穩定運行。
2)提升信創技術能力。針對目前信創應用技術能力缺乏的現狀,就信創相關技術開展相應的交流、培訓、認證等多種形式的活動,提升人員的技術能力。
3)完善人才配備和培養機制。加強各類引入技術的相關學習和培訓,在各類系統實施信創改造時確保做好知識轉移,也可通過同業調研、交流學習的方式,來提升自身人員的專業水準。
4)制定全面的應急方案。針對系統硬件故障及系統軟件缺陷等風險制訂全面的應急預案。并根據項目重要程度合理規劃應急預案演練的形式、數量和規模,提前安排人員和團隊進行演練,保障項目實施的有序可控。
本文以辦公管理系統信創應用改造的過程為例,結合信創運維體系存在的差異和風險進行綜合分析,雖然信創運維體系在目前仍有不足和缺失,但信創的趨勢已是大勢所趨,隨著國家“十四五”數字化的推進,信創產業發展必將持續深化,行業拓展也將不斷加速。而信創運維體系的建立,是信創產業持續發展和加速推進的堅實保障,因此對信創運維體系的帶來的變革值得我們深入研究和探索。在信創大趨勢到來之時,只有打造信創標準運維體系、優化運維管理工具、提升信創技術積累、制定信創運維應急處置方案,才能從容應對信創變革,保障企業數字化的順利轉型和業務的穩定運行。