傳輸網(wǎng)絡(luò)是網(wǎng)絡(luò)通信的基礎(chǔ),為各種通信業(yè)務(wù)提供傳輸通道, 傳輸網(wǎng)絡(luò)的質(zhì)量對(duì)未來的業(yè)務(wù)發(fā)展有著深遠(yuǎn)的影響。本文主要從如何衡量傳輸網(wǎng)絡(luò)可用性、如何提高傳輸網(wǎng)絡(luò)可用性等方面進(jìn)行闡述。
一、網(wǎng)絡(luò)可用性指標(biāo)定義
平均故障間隔時(shí)間:MTBF( Mean Time Between Failures),即在規(guī)定的條件下和規(guī) 定的時(shí)間內(nèi),系統(tǒng)累計(jì)運(yùn)行時(shí)間與故障次數(shù)之比。
平均修復(fù)時(shí)間:MTTR(Mean Time To Repair),即在規(guī)定的條件下和規(guī)定的時(shí)間內(nèi),產(chǎn)品在任一規(guī)定的維修級(jí)別上,修復(fù)性維修總時(shí)間與在該級(jí)別上被修復(fù)產(chǎn)品的故障總數(shù)之比。
可用度:A(Availability),指可維修產(chǎn)品在規(guī)定的條件與時(shí)間內(nèi),維持其規(guī)定功能的能力,它綜合反映可靠性和維修性。計(jì)算方法:產(chǎn)品能工作時(shí)間與能工作時(shí)間、不能工作時(shí)間的和之比。如:A=MTBF/(MTBF+MTTR)。
年停機(jī)時(shí)間:DT(Downtime),在一年內(nèi),產(chǎn)品由于故障維修而處于不能工作的全部時(shí)間之和。停機(jī)時(shí)間跟可用度之間換算關(guān)系:年停機(jī)時(shí)間=(1-A)×8760×60(分鐘)。
通常所指的產(chǎn)品可用性包括可靠性和可維修性兩個(gè)方面??煽啃杂肕TBF來衡量,可維修性用MTTR來衡量,而可用性則用可用度A來衡量。
二、網(wǎng)絡(luò)可用性的相關(guān)因素分析
評(píng)估和建設(shè)一個(gè)高可用性的網(wǎng)絡(luò)是一個(gè)龐大的系統(tǒng)工程,需要對(duì)設(shè)備可靠性、網(wǎng)絡(luò)介質(zhì)的可靠性、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、設(shè)備運(yùn)行環(huán)境、管理和服務(wù)等多方面進(jìn)行綜合分析和改進(jìn)。一般在確定網(wǎng)絡(luò)模型之后,影響整個(gè)網(wǎng)絡(luò)可用性的幾個(gè)主要因素如圖1所示。
網(wǎng)絡(luò)可靠性影響因素大致可以分為:
(1) 傳輸介質(zhì)因素:光纖、光纖連接器、電纜等;
(2) 設(shè)備因素:硬件板卡失效、軟件失效等;
(3) 網(wǎng)絡(luò)設(shè)計(jì)因素:網(wǎng)絡(luò)的整體規(guī)劃、網(wǎng)絡(luò)解決方案等;
(4) 電網(wǎng)及運(yùn)行環(huán)境因素:電網(wǎng)可用率、設(shè)備運(yùn)行環(huán)境等;
(5) 備件、維護(hù)及服務(wù)等因素:備件策略、操作人員培訓(xùn)、網(wǎng)絡(luò)維護(hù)、客戶服務(wù);
(6) 其他一些不可抗力因素:地震、戰(zhàn)爭、洪水等。
三、網(wǎng)絡(luò)可用性的提高
通過前面的簡單介紹可知,影響網(wǎng)絡(luò)可用性的因素眾多,所以實(shí)際分析時(shí)應(yīng)從多個(gè)方面入手,抓住最重要的因素,在網(wǎng)絡(luò)可用性和建設(shè)成本之間找到一個(gè)平衡點(diǎn)。
1. 提高傳輸介質(zhì)的可靠性
對(duì)于一條端到端的電路,對(duì)可用性影響最大的是傳輸介質(zhì)。傳輸介質(zhì)包括光纖、光纖連接器、電纜、電纜連接器及其他傳輸線。
實(shí)際上,傳輸介質(zhì)特別是光纖的可靠性,遠(yuǎn)遠(yuǎn)要比設(shè)備可靠性低。一般認(rèn)為光纖失效率跟傳輸距離是成正比關(guān)系的。根據(jù)GR-418標(biāo)準(zhǔn)提供的光纖可靠性指標(biāo)是400FITs/km,即相當(dāng)于每285km平均每年失效一次。根據(jù)互聯(lián)網(wǎng)上公布的國外某運(yùn)營商的數(shù)據(jù),2003年光纖失效率為422FITs/km,光纖的平均維修時(shí)間為13小時(shí)??梢姽饫w的失效率高、光纖維修時(shí)間長。傳輸介質(zhì)中,除了光纖之外,光纖連接器也很容易失效,經(jīng)常會(huì)由于連接器松動(dòng)、灰塵、連接錯(cuò)誤等造成光纖連接失效。
相比于光纖而言,電纜和電纜連接器比光纖指標(biāo)還要差,其受到人為影響的可能性更大。電纜一般集中在傳輸網(wǎng)的業(yè)務(wù)落地側(cè),不過隨著光口交換機(jī)、路由器的出現(xiàn),傳輸電纜的用量在逐漸減少。一些咨詢公司和運(yùn)營商的統(tǒng)計(jì)數(shù)據(jù)表明,對(duì)于一個(gè)端到端的電路而言,光纖的失效往往在網(wǎng)絡(luò)失效中占有非常大的比例,大部分都超過整個(gè)網(wǎng)絡(luò)失效的50%,有的甚至在80%以上。所以提高網(wǎng)絡(luò)可用性首先要考慮的是提高傳輸介質(zhì)的基本可靠性。
下面是針對(duì)光纖等傳輸介質(zhì)所提出的一些改進(jìn)建議:
(1) 減少光纖和連接器的失效,控制采購質(zhì)量;
(2) 減少光纜保護(hù)盲點(diǎn),如采取接入層成環(huán)、入大樓管道雙路由等保護(hù)措施;
(3) 控制由于人為因素造成的傳輸介質(zhì)失效(比如挖斷等人為破壞);
(4) 局內(nèi)采取各種控制措施:室內(nèi)光纜的有效保護(hù)、光纜/電纜的正確標(biāo)識(shí)、提高插拔光纖/電纜的規(guī)范性、室內(nèi)尾纖的合理布放等;
(5) 建立快速的維護(hù)響應(yīng)隊(duì)伍,減少光纖故障后的維修時(shí)間。
2. 提高設(shè)備基本可靠性
除了光纖之外,設(shè)備也是影響網(wǎng)絡(luò)基本可靠性的主要因素。設(shè)備的硬件和軟件都可能失效,對(duì)于不同的通信設(shè)備,軟硬件失效比例是不同的。一般而言,傳輸設(shè)備硬件失效率要比軟件失效率高一些,而路由器設(shè)備的軟件失效率要比硬件失效率高。根據(jù)GR-418提供的數(shù)據(jù),傳輸設(shè)備軟硬件失效比例為1:3。
硬件失效與很多的因素相關(guān),最主要的是器件的基本失效。器件失效率可以根據(jù)溫度、靜電影響、環(huán)境等參考相應(yīng)標(biāo)準(zhǔn)(GJB299、TR-332)進(jìn)行預(yù)計(jì)。除器件的基本失效之外,還有其他原因會(huì)間接影響到器件失效,如硬件的設(shè)計(jì)、制造、工藝、環(huán)境、EMC等。
軟件的失效是由于軟件設(shè)計(jì)過于復(fù)雜、對(duì)異常情況考慮不完善、軟件的BUG等導(dǎo)致。一般是通過CMM流程的質(zhì)量控制和對(duì)軟件可靠性的度量、分析、測試來保證軟件可靠性。軟件失效除了可能導(dǎo)致板卡的功能失效之外,還可能導(dǎo)致系統(tǒng)或者整個(gè)網(wǎng)絡(luò)的功能失效,并且軟件失效后一般影響較大,故障難以定位。
因?yàn)樯鲜鲆恍┮蛩氐挠绊?,設(shè)備制造商在生產(chǎn)設(shè)備的過程中需通過各種設(shè)計(jì)流程、質(zhì)量保證流程、閉環(huán)等措施保證設(shè)備的可靠性。華為公司對(duì)于提高設(shè)備可靠性方面的主要保障措施主要表現(xiàn)在:通過完善的集成產(chǎn)品開發(fā)流程保證設(shè)備軟硬件設(shè)計(jì)的可靠性;通過系統(tǒng)可靠性設(shè)計(jì)優(yōu)化系統(tǒng)結(jié)構(gòu),充分考慮網(wǎng)絡(luò)的解決方案;通過全面采購控制、設(shè)計(jì)規(guī)范等保證器件可靠性和應(yīng)用的規(guī)范;提供閉環(huán)的問題處理、跟蹤流程,保證問題及時(shí)解決和跟蹤;通過FIT測試、老化試驗(yàn)、環(huán)境試驗(yàn)、HALT試驗(yàn)等措保障設(shè)備可靠性;設(shè)計(jì)中全面考慮故障檢測、隔離、恢復(fù)設(shè)計(jì),提高設(shè)備故障管理能力;通過CMM流程保證軟件開發(fā)的規(guī)范,通過對(duì)軟件的度量、分析和FIT測試保證軟件可靠性;考慮設(shè)備支持計(jì)劃性的在線升級(jí)、補(bǔ)丁、擴(kuò)容等功能;對(duì)關(guān)鍵部件采用1+1保護(hù)提高設(shè)備可靠性,比如交叉板卡1+1,電源接入模塊1+1等。所以,設(shè)備商的實(shí)際研發(fā)能力、完善的可靠性保障流程也應(yīng)該是運(yùn)營商在采購設(shè)備時(shí)考慮的重要因素。
四、優(yōu)化網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
隨著客戶需求的變化、傳送技術(shù)的發(fā)展以及市場競爭的加劇,傳輸網(wǎng)絡(luò)將逐步從SDH向ASON演進(jìn),網(wǎng)絡(luò)保護(hù)也將從1+1保護(hù)逐步向MESH組網(wǎng)保護(hù)發(fā)展。屆時(shí)網(wǎng)絡(luò)設(shè)計(jì)已經(jīng)不再是將簡單的幾個(gè)設(shè)備連接在一起組成一個(gè)網(wǎng)絡(luò)那么簡單,而是需要根據(jù)實(shí)際的網(wǎng)絡(luò)結(jié)構(gòu)和現(xiàn)狀,提供一個(gè)低成本、高可用性、高利用率的解決方案。
由于光纖介質(zhì)的失效是整個(gè)網(wǎng)絡(luò)中影響最大的,因此首先應(yīng)該對(duì)光纖傳輸距離較長的網(wǎng)絡(luò)進(jìn)行網(wǎng)絡(luò)保護(hù),比如MSP、SNCP、MESH等。除了保護(hù)光纖失效外,還要考慮對(duì)于掉電可能性大的站點(diǎn)增加節(jié)點(diǎn)保護(hù)。對(duì)于可靠性要求高的網(wǎng)絡(luò)可以考慮采用MESH組網(wǎng)保護(hù)。下面提供幾種增強(qiáng)網(wǎng)絡(luò)可用性的組網(wǎng)方法。
(1) 增強(qiáng)網(wǎng)絡(luò)保護(hù)能力以減少光纖、節(jié)點(diǎn)失效的影響;
(2) 重要業(yè)務(wù)節(jié)點(diǎn)之間采用1+1MSP鏈保護(hù);
(3) 通過采用小環(huán)加小環(huán)的組網(wǎng)方式代替大環(huán)組網(wǎng),減少光纖失效影響;
(4) 減少傳輸路徑長度和傳輸節(jié)點(diǎn)個(gè)數(shù),用大容量設(shè)備取代背靠背轉(zhuǎn)接。
總之,網(wǎng)絡(luò)的設(shè)計(jì)需要針對(duì)網(wǎng)絡(luò)的運(yùn)行環(huán)境、網(wǎng)絡(luò)的定位、不同的客戶需求等進(jìn)行綜合分析,以便給出滿足客戶需求的解決方案。
五、提高電網(wǎng)與設(shè)備運(yùn)行環(huán)境
環(huán)境因素的影響包括多個(gè)方面,最主要的是電網(wǎng)環(huán)境因素。這方面在國內(nèi)尤為嚴(yán)重,有運(yùn)營商的統(tǒng)計(jì)數(shù)據(jù)表明,在部分電源條件不好(如使用農(nóng)村電力、機(jī)房無蓄電池)的本地網(wǎng)絡(luò),掉電事故占所有事故的50%以上,部分地方比例更高。而且電網(wǎng)的失效往往會(huì)導(dǎo)致整個(gè)設(shè)備掉電,甚至導(dǎo)致整個(gè)站點(diǎn)或者機(jī)房所有設(shè)備的失效。除了電網(wǎng)事故直接導(dǎo)致網(wǎng)絡(luò)上節(jié)點(diǎn)的失效外,還有其他一些直接導(dǎo)致設(shè)備失效的原因如:火災(zāi)、地震、臺(tái)風(fēng)、洪水等不可抗拒的因素。
其他環(huán)境因素一般指環(huán)境溫度、濕度、鹽霧、粉塵等。這些因素會(huì)間接的逐步影響設(shè)備可靠性,比如縮短設(shè)備使用壽命、導(dǎo)致器件失效率增加、加快設(shè)備腐蝕等。
以下是針對(duì)環(huán)境因素所提供的改進(jìn)方法:
(1) 通過對(duì)設(shè)備配備蓄電池、油機(jī)等備用電源,減少設(shè)備掉電導(dǎo)致的節(jié)點(diǎn)故障;
(2) 通過優(yōu)化組網(wǎng)方式,如增加備份節(jié)點(diǎn),相互備份的重要站點(diǎn)不要放于同一機(jī)房等;
(3) 對(duì)于重要的節(jié)點(diǎn)要提供空調(diào)環(huán)境;
(4) 通過環(huán)境改造,減少高溫高濕、鹽霧粉塵和腐蝕性氣體對(duì)設(shè)備的影響。
六、提高備件、維護(hù)、服務(wù)水平
在建設(shè)一個(gè)網(wǎng)絡(luò)的同時(shí),必須配備相應(yīng)的備件。備件方式和備件策略的好壞直接影響到最終板件失效后的維修時(shí)間。備件離故障點(diǎn)越近,故障的維修時(shí)間就越短,網(wǎng)絡(luò)的可用性就會(huì)越高,但是如果備件的庫存太多又會(huì)增加庫存的成本。需根據(jù)實(shí)際情況確定備件更換率、周轉(zhuǎn)時(shí)間、備件成本等因素,綜合分析確定備件策略。
維護(hù)操作異常是人為造成設(shè)備失效的主要原因。維護(hù)操作的異常包括因操作流程的不規(guī)范導(dǎo)致直接發(fā)生事故,維護(hù)人員維護(hù)不及時(shí)導(dǎo)致事故以及割接和擴(kuò)容導(dǎo)致業(yè)務(wù)中斷等。
服務(wù)水平是體現(xiàn)設(shè)備商綜合能力的重要因素,服務(wù)的好壞直接影響到一個(gè)網(wǎng)絡(luò)的可靠運(yùn)營。比如對(duì)設(shè)備的定期巡檢、對(duì)用戶需求的快速響應(yīng)、對(duì)設(shè)備問題的快速定位和及時(shí)處理、對(duì)客戶的定期培訓(xùn)和交流等都會(huì)間接的提高網(wǎng)絡(luò)的可用性。
下面是針對(duì)備件、維護(hù)、服務(wù)等方面的改進(jìn)措施。
(1) 優(yōu)化維護(hù)體制,建立快速響應(yīng)的維護(hù)隊(duì)伍,減少業(yè)務(wù)中斷時(shí)間。包括對(duì)設(shè)備的維修和傳輸介質(zhì)的維修;
(2) 通過提高維護(hù)隊(duì)伍的分布、技術(shù)水平,增加對(duì)維護(hù)人員的技術(shù)、流程培訓(xùn),從而減少操作事故、減少故障定位時(shí)間;
(3) 制定完善的備件策略,減少備件響應(yīng)時(shí)間;
(4) 采購設(shè)備時(shí)考慮設(shè)備制造商提供的服務(wù)水平;
(5) 增加計(jì)劃性的維修,減少潛在故障的發(fā)生。
溫馨提示:因考試政策、內(nèi)容不斷變化與調(diào)整,信管網(wǎng)網(wǎng)站提供的以上信息僅供參考,如有異議,請(qǐng)以權(quán)威部門公布的內(nèi)容為準(zhǔn)!
信管網(wǎng)致力于為廣大信管從業(yè)人員、愛好者、大學(xué)生提供專業(yè)、高質(zhì)量的課程和服務(wù),解決其考試證書、技能提升和就業(yè)的需求。
信管網(wǎng)軟考課程由信管網(wǎng)依托10年專業(yè)軟考教研傾力打造,官方教材參編作者和資深講師坐鎮(zhèn),通過深研歷年考試出題規(guī)律與考試大綱,深挖核心知識(shí)與高頻考點(diǎn),為學(xué)員考試保駕護(hù)航。面授、直播&錄播,多種班型靈活學(xué)習(xí),滿足不同學(xué)員考證需求,降低課程學(xué)習(xí)難度,使學(xué)習(xí)效果事半功倍。
發(fā)表評(píng)論 查看完整評(píng)論 | |