《信息安全技術(shù) 數(shù)據(jù)安全能力成熟度模型》(GB/T 37988-2019)簡稱DSMM(Data Security Maturity Model)正式成為國標(biāo)對外發(fā)布,并已于2020年3月起正式實(shí)施。美創(chuàng)科技將以DSMM數(shù)據(jù)安全治理思路為依托,針對各過程域,基于充分定義級視角(3級),提供數(shù)據(jù)安全建設(shè)實(shí)踐建議,形成系列文章。本文作為本系列第六篇文章,將介紹數(shù)據(jù)傳輸安全階段的網(wǎng)絡(luò)可用性管理過程域(PA06)。
隨著《中華人民共和國數(shù)據(jù)安全法(草案)》的公布,后續(xù)DSMM很可能會成為該法案的具體落地標(biāo)準(zhǔn)和衡量指標(biāo),對于中國企業(yè)而言,以DSMM為數(shù)據(jù)安全治理思路方案選型,可以更好的實(shí)現(xiàn)數(shù)據(jù)安全治理的制度合規(guī)。
DSMM將6個生命周期進(jìn)一步細(xì)分,劃分出30個過程域。這30個過程域分別分布在數(shù)據(jù)生命周期的6個階段,部分過程域貫穿于整個數(shù)據(jù)生命周期。
本文作為《數(shù)據(jù)安全能力成熟度模型》實(shí)踐指南系列第六篇文章,將介紹數(shù)據(jù)傳輸安全階段的網(wǎng)絡(luò)可用性管理過程域(PA06)。
網(wǎng)絡(luò)可用性管理,DSMM官方描述定義為通過網(wǎng)絡(luò)基礎(chǔ)設(shè)施及網(wǎng)絡(luò)層數(shù)據(jù)防泄漏設(shè)備的備份建設(shè),實(shí)現(xiàn)網(wǎng)絡(luò)的高可用性,從而保證數(shù)據(jù)傳輸過程的穩(wěn)定性。
DSMM標(biāo)準(zhǔn)在充分定義級對網(wǎng)絡(luò)可用性管理要求如下:
1) 組織建設(shè)
組織應(yīng)設(shè)立負(fù)責(zé)網(wǎng)絡(luò)可用性管理的人員或團(tuán)隊(duì)。
2) 制度流程
應(yīng)制定組織的網(wǎng)絡(luò)可用性管理指標(biāo),包括可用性的概率數(shù)值、故障時間/頻率/統(tǒng)計(jì)業(yè)務(wù)單元等;基于可用性管理指標(biāo),建立網(wǎng)絡(luò)服務(wù)配置方案和宕機(jī)替代方案等。
3) 技術(shù)工具
? 應(yīng)對關(guān)鍵的網(wǎng)絡(luò)傳輸鏈路、網(wǎng)絡(luò)設(shè)備節(jié)點(diǎn)實(shí)行冗余建設(shè);
? 應(yīng)部署相關(guān)設(shè)備對網(wǎng)絡(luò)可用性及數(shù)據(jù)泄漏風(fēng)險(xiǎn)進(jìn)行防范,如負(fù)載均衡、防入侵攻擊、數(shù)據(jù)防泄漏檢測與防護(hù)等設(shè)備。
4) 人員能力
負(fù)責(zé)該項(xiàng)工作的人員應(yīng)具有網(wǎng)絡(luò)安全管理的能力,了解網(wǎng)絡(luò)安全中對可用性的安全需求,能夠根據(jù)不同業(yè)務(wù)對網(wǎng)絡(luò)性能需求制定有效的可用性安全防護(hù)方案。
1) 組織建設(shè)
美創(chuàng)科技專家認(rèn)為組織機(jī)構(gòu)在條件允許的情況下應(yīng)該設(shè)立一個網(wǎng)絡(luò)可用性管理部門以及招募相關(guān)的人員負(fù)責(zé)管理公司的網(wǎng)絡(luò)可用性,為公司制定整體的網(wǎng)絡(luò)可用性管理方案和標(biāo)準(zhǔn),包括制定可用性的標(biāo)準(zhǔn)數(shù)值、故障指標(biāo)、故障處理方案等,對公司的網(wǎng)絡(luò)節(jié)點(diǎn)、傳輸鏈路進(jìn)行考察,并部署相應(yīng)設(shè)備保障網(wǎng)絡(luò)可用性、防止出現(xiàn)數(shù)據(jù)泄露等風(fēng)險(xiǎn),同時還應(yīng)根據(jù)公司不同的業(yè)務(wù)環(huán)境所提出的各種網(wǎng)絡(luò)性能需求制定有效可靠的數(shù)據(jù)安全防護(hù)方案等。
2) 人員能力
針對網(wǎng)絡(luò)可用性管理部門的相關(guān)人員,必須具備良好的數(shù)據(jù)安全風(fēng)險(xiǎn)意識,熟悉國家網(wǎng)絡(luò)安全法律法規(guī)以及組織機(jī)構(gòu)所屬行業(yè)的政策和監(jiān)管要求,在進(jìn)行網(wǎng)絡(luò)可用性管理的時候主要依據(jù)《網(wǎng)絡(luò)安全法》中的相關(guān)要求,對公司的網(wǎng)絡(luò)可用性做好管理與保護(hù),除此之外,還需要相關(guān)人員具備良好的網(wǎng)絡(luò)架構(gòu)基礎(chǔ),熟悉公司內(nèi)部的網(wǎng)絡(luò)結(jié)構(gòu)和環(huán)境,熟悉常用的網(wǎng)絡(luò)安全防護(hù)設(shè)備,熟悉常見的網(wǎng)絡(luò)威脅手段,能夠在公司內(nèi)部的網(wǎng)絡(luò)環(huán)境中根據(jù)不同部門或業(yè)務(wù)對網(wǎng)絡(luò)環(huán)境的不同要求,制定高效可靠的網(wǎng)絡(luò)安全防護(hù)方案,網(wǎng)絡(luò)可用性管理方案等,并推動相關(guān)要求確實(shí)有效的落地執(zhí)行。
針對業(yè)務(wù)團(tuán)隊(duì)的技術(shù)團(tuán)隊(duì)人員,必須具備足夠的網(wǎng)絡(luò)設(shè)備搭建經(jīng)驗(yàn),網(wǎng)絡(luò)設(shè)備維護(hù)管理和網(wǎng)絡(luò)可用性維護(hù)管理等經(jīng)驗(yàn),了解業(yè)務(wù)團(tuán)隊(duì)的所有業(yè)務(wù)環(huán)境,具備一定的應(yīng)急響應(yīng)能力,在面對突發(fā)性網(wǎng)絡(luò)癱瘓的情況時,應(yīng)及時進(jìn)行應(yīng)急處置,并上報(bào)網(wǎng)路可用性管理部門,進(jìn)行溯源排查等。
3) 落地執(zhí)行性確認(rèn)
針對網(wǎng)絡(luò)可用性管理人員能力的實(shí)際落地執(zhí)行性確認(rèn),可通過內(nèi)部審計(jì)、外部審計(jì)等形式以調(diào)研訪談、問卷調(diào)查、流程觀察、文件調(diào)閱、技術(shù)檢測等多種方式實(shí)現(xiàn)。
4) 制度流程
? 網(wǎng)絡(luò)可用性管理指標(biāo)
可用性指系統(tǒng)或組件在指定的條件和時間內(nèi),維持其規(guī)定功能的能力,通常以百分比標(biāo)識并能綜合反映設(shè)備的可靠性和可維修性。美創(chuàng)科技專家認(rèn)為影響網(wǎng)絡(luò)可用性的主要因素有網(wǎng)絡(luò)的設(shè)計(jì)結(jié)構(gòu)、設(shè)備的可靠性、傳輸介質(zhì)和設(shè)備運(yùn)行環(huán)境因素。網(wǎng)絡(luò)可用性常用到以下指標(biāo):
①平均無故障時間(Mean Time Between Failures,MTBF),即整個網(wǎng)絡(luò)的各組件(鏈路、節(jié)點(diǎn))不間斷無故障連續(xù)運(yùn)行的平均時間。MTBF越大,表明越不容易出故障,可用性自然高。MTBF反映的是網(wǎng)絡(luò)的可靠性(reliability);
②平均修復(fù)時間(Mean Time To Repair,MTTR),即從故障發(fā)生到故障消除所需要的平均時間。MTTR越小,表示故障時間越短,可用性也就越高。出現(xiàn)故障后,要經(jīng)過檢查、識別、定位、修復(fù)和核查過程,還可能出現(xiàn)技術(shù)延遲和后勤延遲,MTTR不僅與設(shè)備的種類和所在位置有關(guān),與是否使用網(wǎng)絡(luò)管理系統(tǒng)及該系統(tǒng)的響應(yīng)速度和告警能力有關(guān),還與維修隊(duì)伍的整體素質(zhì)(包括體質(zhì)、管理、責(zé)任心、維修支援能力等因素)有關(guān);
③可用度(Availability):可用性的定量描述;
④不可用度(Unavailability):與可用度相對;
? 提高網(wǎng)絡(luò)可用性
①在網(wǎng)絡(luò)規(guī)劃設(shè)計(jì)階段,需要細(xì)致分析業(yè)務(wù)模型,確定基礎(chǔ)網(wǎng)絡(luò)拓?fù)洌瑢τ绊懢W(wǎng)絡(luò)可用性的關(guān)鍵節(jié)點(diǎn)和鏈路必須做充分的冗余設(shè)計(jì),并根據(jù)網(wǎng)絡(luò)結(jié)構(gòu),在各個層次、各個節(jié)點(diǎn)部署合適的高可用性技術(shù)。
②在組件或設(shè)備選型時,除保證技術(shù)指標(biāo)外,也要有足夠高的可靠性指標(biāo)。
③持續(xù)進(jìn)行網(wǎng)絡(luò)維護(hù)和優(yōu)化。利用高效的網(wǎng)絡(luò)設(shè)備管理工具持續(xù)監(jiān)控、分析、預(yù)測、優(yōu)化,最大限度的規(guī)避網(wǎng)絡(luò)擁塞。
④在進(jìn)行軟硬件版本升級或新設(shè)備,新業(yè)務(wù)上線時,需要事先詳細(xì)規(guī)劃,制定應(yīng)急預(yù)案。
⑤高度關(guān)注網(wǎng)絡(luò)安全問題。定期對主機(jī)系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)進(jìn)行安全評估,構(gòu)建一個多層次的安全防御和預(yù)警系統(tǒng)。
⑥做好業(yè)務(wù)系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)的協(xié)調(diào)。積極分析業(yè)務(wù)模型,并適當(dāng)?shù)倪M(jìn)行調(diào)整,可以讓網(wǎng)絡(luò)更通暢。
? 網(wǎng)絡(luò)服務(wù)配置原則
①層次化:分層次設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu),嚴(yán)格定義各層次的功能;
②模塊化:根據(jù)區(qū)域劃分拓?fù)浣Y(jié)構(gòu);
③可擴(kuò)展:根據(jù)業(yè)務(wù)發(fā)展需要,通過簡單復(fù)制模塊單元來拓展網(wǎng)絡(luò);
④冗余設(shè)計(jì):提供設(shè)備和鏈路的冗余保護(hù);
? 網(wǎng)絡(luò)可用性管理規(guī)范
①設(shè)定網(wǎng)絡(luò)可用性管理部門,負(fù)責(zé)網(wǎng)絡(luò)及其組件設(shè)備的日常維護(hù)以及網(wǎng)絡(luò)故障的應(yīng)急工作,全面負(fù)責(zé)可能出現(xiàn)的各種突發(fā)事件處置工作,并協(xié)調(diào)解決網(wǎng)絡(luò)故障處置工作中的重大問題。
②網(wǎng)絡(luò)故障發(fā)生前,網(wǎng)絡(luò)可用性管理部門需預(yù)先對網(wǎng)絡(luò)故障預(yù)警預(yù)報(bào)體系進(jìn)行建設(shè),編制網(wǎng)絡(luò)故障防治規(guī)劃。
③網(wǎng)絡(luò)可用性管理部門需加強(qiáng)對網(wǎng)絡(luò)及各組件的日常監(jiān)測及其日志保存工作,發(fā)現(xiàn)險(xiǎn)情時,需及時向領(lǐng)導(dǎo)小組報(bào)告。
④網(wǎng)絡(luò)可用性管理部門要嚴(yán)格執(zhí)行值班制度,以保障最先發(fā)現(xiàn)網(wǎng)絡(luò)故障并及時處置次突發(fā)事件。
⑤建立健全網(wǎng)絡(luò)故障速報(bào)制度,保障突發(fā)性網(wǎng)絡(luò)故障信息可立即發(fā)布預(yù)警。
⑥網(wǎng)絡(luò)故障發(fā)生時,立即啟動應(yīng)急預(yù)案,采取應(yīng)急處置程序,判定網(wǎng)絡(luò)故障級別,并立即向領(lǐng)導(dǎo)小組報(bào)告。在網(wǎng)絡(luò)故障處置過程中,應(yīng)及時報(bào)告網(wǎng)絡(luò)故障處置工作的進(jìn)展情況,直至故障修復(fù)。
⑦網(wǎng)絡(luò)故障消除后,由網(wǎng)絡(luò)可用性管理部門向領(lǐng)導(dǎo)小組宣布網(wǎng)絡(luò)故障應(yīng)急期結(jié)束,并予以公告,同時預(yù)案終止。
5) 技術(shù)工具簡述
數(shù)據(jù)在網(wǎng)絡(luò)傳輸過程中依賴網(wǎng)絡(luò)的可用性,一旦發(fā)生網(wǎng)絡(luò)故障或者癱瘓,數(shù)據(jù)傳輸也會受到影響甚至中斷。網(wǎng)絡(luò)可用性管理過程域的設(shè)定,即要求建設(shè)高可用性的網(wǎng)絡(luò),從而保證數(shù)據(jù)傳輸過程的穩(wěn)定性。所謂網(wǎng)絡(luò)可用性并不是單純的網(wǎng)絡(luò)設(shè)備、服務(wù)器或節(jié)點(diǎn)的通斷,而是一種綜合管理信息,以反映支持業(yè)務(wù)的網(wǎng)絡(luò)是否具有業(yè)務(wù)所要求的可用性。網(wǎng)絡(luò)系統(tǒng)的可用性包括:鏈路的可用性,交換節(jié)點(diǎn)的可用性(如交換機(jī)和路由器),主機(jī)系統(tǒng)的可用性,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的可用性,電源的可用性以及配置的可用性等。但由于網(wǎng)絡(luò)節(jié)點(diǎn)與網(wǎng)絡(luò)鏈路的故障無法完全避免,因此構(gòu)建高可用性網(wǎng)絡(luò)的基礎(chǔ)就是要實(shí)現(xiàn)快速故障發(fā)現(xiàn)和快速故障恢復(fù),在這個過程中涉及相關(guān)的檢測手段及冗余措施。
目前網(wǎng)絡(luò)可用性的主要考核指標(biāo)公式可參考以下
網(wǎng)絡(luò)可用性的計(jì)算公式:
A=MTBF/(MTBF+MTTR)*100%
DT=(1-A)*365*24*60
從上述公式我們可以看出,為了提高網(wǎng)絡(luò)可用性,我們需要盡量的提高平均故障間隔時間(MTBF),即保證網(wǎng)絡(luò)在規(guī)定時間內(nèi)不出故障或少出故障,主要的措施有避錯和容錯機(jī)制。同時降低平均修復(fù)時間(MTTR),即網(wǎng)絡(luò)出了故障要能迅速修復(fù),主要措施時快速檢錯和快速排錯(恢復(fù))。因此主要有4方面技術(shù)方法來提高網(wǎng)絡(luò)可用性。
? 避錯措施
避錯就是通過改進(jìn)硬件的制造工藝和設(shè)計(jì),選擇技術(shù)成熟可靠的軟硬件等策略來防止網(wǎng)絡(luò)系統(tǒng)的錯誤產(chǎn)生,從而提高網(wǎng)絡(luò)的可靠性,并通過可靠性來提高網(wǎng)絡(luò)的可用性。
避錯方法包括各種硬件、軟件和管理措施。
①硬件避錯方法是通過改進(jìn)硬件的制造工藝和設(shè)計(jì),防止錯誤的產(chǎn)生,包括網(wǎng)絡(luò)中電氣系統(tǒng)的避錯、網(wǎng)絡(luò)設(shè)備的避錯、服務(wù)器的避錯和網(wǎng)絡(luò)中傳輸媒體的避錯等。
②軟件避錯方法包括形式說明、過程管理、軟件測試和程序設(shè)計(jì)技術(shù)選擇等,例如網(wǎng)絡(luò)應(yīng)用系統(tǒng)的避錯和成熟可靠的網(wǎng)絡(luò)操作系統(tǒng)的使用等。
③管理避錯方法要求網(wǎng)絡(luò)運(yùn)行管理要嚴(yán)格按照規(guī)范進(jìn)行,包括制度建設(shè)、任務(wù)分配、設(shè)備標(biāo)識、規(guī)范文檔記錄、各種軟硬件日常維護(hù)和網(wǎng)絡(luò)安全管理標(biāo)準(zhǔn)等,例如管理信息存儲的避錯、網(wǎng)絡(luò)中網(wǎng)絡(luò)結(jié)構(gòu)選擇的避錯和日常網(wǎng)絡(luò)管理的避錯等
? 容錯機(jī)制
避錯方法可以提高網(wǎng)絡(luò)可靠性,但無論多么可靠的系統(tǒng)都會出現(xiàn)系統(tǒng)失效,光靠避錯方法不能完全解決系統(tǒng)的可靠性,因此通過容錯技術(shù),外加冗余資源消除單點(diǎn)故障使系統(tǒng)在單點(diǎn)故障中仍能正常工作。冗余資源主要包含三塊:硬件冗余、軟件冗余、路由冗余。
? 快速檢錯
實(shí)現(xiàn)快速檢錯包括故障檢測和故障診斷兩方面,故障檢測的作用是確定故障是否存在,故障診斷的作用是確定故障的位置。一般快速檢錯是從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點(diǎn),查找問題的根源具體包括:
①自動檢錯而不是人工檢錯可以更快提高檢錯的速度;
②借助線路檢測工具(如線纜測試儀、時間域反射計(jì))可以加快線路故障的檢錯速度;
③利用網(wǎng)絡(luò)管理系統(tǒng)專門的管理進(jìn)程不斷地檢測路由器的關(guān)鍵數(shù)據(jù)并及時給出報(bào)警可以加快路由器故障的檢測速度;
④通過工具自動監(jiān)視主機(jī)流量、掃描主機(jī)端口和服務(wù)來檢測主機(jī)的異常,可以加快主機(jī)故障的檢測速度;
⑤利用網(wǎng)絡(luò)測試儀可以自動定位網(wǎng)絡(luò)故障源,找出故障點(diǎn)并顯示其網(wǎng)絡(luò)相關(guān)信息,從而加快邏輯故障的檢測速度;
⑥利用網(wǎng)絡(luò)分析工具進(jìn)行快速檢錯,如協(xié)議分析程序Snigger,操作系統(tǒng)中內(nèi)置的一些非常有用的軟件網(wǎng)絡(luò)測試工具等;
? 快速排錯(恢復(fù))
排錯事在網(wǎng)絡(luò)出現(xiàn)故障時,逐一排除故障,恢復(fù)系統(tǒng)的可用性。網(wǎng)絡(luò)故障排錯的方法分為:
①分層故障排錯法:它主要根據(jù)網(wǎng)絡(luò)分層的概念進(jìn)行逐步分析的方法;
②分塊故障排錯法:此方法從設(shè)備的配置文件入手,將配置文件分為管理部分、端口部分、路由協(xié)議部分、策略部分和接入部分,并對其逐一進(jìn)行檢查排錯;
③分段故障排錯法:此方法是把網(wǎng)絡(luò)分段,逐段排除故障;
④替換法:替換法是檢查硬件問題最常用的方法。如懷疑是網(wǎng)線問題時,更換一根確定完好的網(wǎng)線嘗試。
受限于篇幅,美創(chuàng)科技技術(shù)專家不再對此處技術(shù)工具進(jìn)行進(jìn)一步展開,在網(wǎng)絡(luò)系統(tǒng)的不同建設(shè)階段,我們可以選擇性的引入不同的技術(shù)工具,這里我們按照網(wǎng)絡(luò)系統(tǒng)建設(shè)的三個階段:網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)期、網(wǎng)絡(luò)系統(tǒng)建設(shè)期、網(wǎng)絡(luò)系統(tǒng)維護(hù)期來理解技術(shù)工具的使用
? 網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)期:網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)期的時候,網(wǎng)絡(luò)系統(tǒng)還處于不完整的狀態(tài),在這個階段,可以根據(jù)避錯措施中涉及的各方面,對網(wǎng)絡(luò)系統(tǒng)涉及到的硬件、軟件進(jìn)行選型,在經(jīng)濟(jì)許可的情況下,選擇技術(shù)成熟可靠的軟硬件等策略來防止網(wǎng)絡(luò)系統(tǒng)的錯誤產(chǎn)生
? 網(wǎng)絡(luò)系統(tǒng)建設(shè)期:網(wǎng)絡(luò)系統(tǒng)建設(shè)期時,此時網(wǎng)絡(luò)基本可用,為防止突發(fā)的網(wǎng)絡(luò)事故導(dǎo)致網(wǎng)絡(luò)不可用的情況,此時引入容錯措施,通過硬件或軟件的負(fù)載均衡增加網(wǎng)絡(luò)可靠性。
? 網(wǎng)絡(luò)系統(tǒng)維護(hù)期:通過前面的避錯、容錯措施的建設(shè),網(wǎng)絡(luò)可用性大大增強(qiáng),同時網(wǎng)絡(luò)出錯的概率也大大降低,此時主要是針對日常網(wǎng)絡(luò)系統(tǒng)的監(jiān)控、檢錯、排錯,使用相關(guān)技術(shù)工具,不斷減少平均修復(fù)時間,從而實(shí)現(xiàn)網(wǎng)絡(luò)可用性的全維度把控。
網(wǎng)絡(luò)可用性管理過程域的實(shí)踐指南就展開至此,《數(shù)據(jù)安全能力成熟度模型》實(shí)踐指南系列持續(xù)更新中,歡迎持續(xù)關(guān)注。
聯(lián)系客服