隨著5G技術不斷的升級更新,相關的應用范圍也在不斷地拓展擴大,行業應用對網絡建設提出了更嚴苛的高帶寬、低時延等要求。以往通信網絡越來越集中式的網絡形態正悄悄地將部分計算能力向邊緣演進。此時,運維系統架構、運維操作場景等都在發生著巨大的變化。集約化運維的大背景下,如何與邊緣運維有機的協同,變得尤為重要。
什么是邊緣計算?
“邊緣”一詞來自抽象的地理區域,分布式計算就發生在當今的云技術環境中。一般來說,“云計算”由一組連接的服務器組成,這些服務器群集在一起,以防止服務器級的故障。未來,移動邊緣計算(MEC)是5G的一個重要應用場景,在移動邊緣計算領域,通過邊緣節點的下沉,能夠進一步提升業務體驗指標,優化提升用戶感知。
為保證包含邊緣節點的系統部署迅速,運行穩定,需要有一整套完整的自動化邊緣運維系統來支撐邊緣計算整體架構。
什么是邊緣運維架構?
根據ETSI協議規范定義,邊緣計算網管系統,由NFVO、MEAO、EMS、MEPM、VNFM(含MEP LCM和APP LCM)等管理節點構成。
同時,網管系統向上還可以對接業務運營系統,提供邊緣業務開通、變更和監控能力開放等能力;向下對接邊緣節點,實現對節點資源和業務的部署、生命周期管理、配置和監控保障能力。
圖1:MEC標準架構圖
可以看到,這樣的運維架構較原有運維系統又多出若干管理節點,整體復雜性大大提升,給運維系統的建設及日常運維工作均帶來很大的挑戰,具體包括:
挑戰一:APP統一管理。邊緣應用APP種類繁多,部分APP具備CT特性,可提供原CT應用包的全部部署要素;部分應用僅有部署包,并且僅需要基本實例化部署,不需復雜特性;還有一些應用,并不需要網管編排器來進行編排實例化,僅需分配相關的虛擬資源即可。多種部署方式對于部署管理節點的要求就是多樣的,需要分不同場景來支持;
挑戰二:APP部署形態不同,相應的資源池需要統一管理。部分網元采用虛機形態,部分網元采用虛機+容器形態,部分網元采用裸機容器形態。對于不同部署形態的網元,編排管理器均要能完整的滿足其部署及管理要求;
挑戰三:管理域多節點協同。從圖中可以看出,MEC管理節點眾多,各管理節點如何有機的協同合作成為關鍵,如OSS發起APP部署過程中,如何將APP接入MEPM中,如何完成APP的初始配置及規則下發,如何選擇及限制APP需要的Service。
邊緣云管解決方案分析
首先,我們需要梳理在邊緣云管理節點中,一共需包含的管理節點:
1) MEAO通過調用NFVO/VNFM能力,實現對于UPF、MEP等虛擬化電信網元的生命周期管理能力;
2) MEAO調用NFVO/VNFM能力,實現對于MEC APP的生命周期管理能力;與邊緣云節點VIM/CISM實現第三方APP等業務的資源發放;
3) MEAO調用邊緣云節點EMS/MEPM實現UPF、MEP的業務配置能力;
4) EMS實現對于UPF的運維管理能力;
5) MEPM實現對于MEP的運維管理能力,管理APP的規則和需求;
6) 各類運維管理工具,實現邊緣節點資源池的監控、巡檢、故障分析定位等能力;
第三方應用管理系統通常由第三方應用廠家配套提供,實現對APP業務的管理能力,即第三方應用的EMS。
圖2:多個管理節點的融合,降低運維復雜度
邊緣節點管理自動化,讓運維更智能
對于邊緣云節點,其運維的總體要求與中心云運維要求相當,其中包括規劃設計、部署、維護、優化運營等。但邊緣云由于其特有的靈活、小、節點多等特點,決定了對于邊緣云的運維,必須引入足夠的自動化能力才能方便對眾多的邊緣節點形成有效的運維建議。
設計自動化:通過采集網絡話務模型參數,可自動識別當前及未來一定周期內的網絡容量,根據資源模型折算為系統需要的資源數量,包括邊緣節點數量等,可提前告知規劃設計人員進行網絡擴容或新址開通。
部署自動化:邊緣節點可能數量巨大,如果均采用人工逐個部署的話,會導致時間過長,容易出錯,成本較大等系列問題。邊緣節點自動化部署,要求在完成核心數據中心部署后,邊緣節點可以實現即插即用,自動化安裝部署,邊緣設備一旦上電完成后,配置數據自動加載,業務自動激活,達到無人化操作,提交部署效率,縮減部署成本。
同時APP部署采用分級管理體系,部分APP采用標準部署包進行部署,可增強部署要求,提供完整生命周期能力;部分APP可采用簡化部署方案,縮減部署成本,提高部署效率。不同場景不同要求可采用不同的方式。
運維自動化:為高效地管理邊緣節點,降低運維復雜度和成本,邊緣計算運維管理系統必須具備網絡自感知、自調整等智能化閉環保障能力。最迫切需要解決的是通過智能算法實現問題快速定界定位,找出問題根因,讓問題解決更加高效。
同時,目前網絡策略仍是基于人工靜態配置,忽略了網絡的實際情況。引入AI后可基于時間、位置和移動特性等因素,結合網絡中的流量、擁塞級別、負載狀態等進行智能分析和判斷,通過AI訓練平臺輸出動態策略,實現智能化調度。
優化運營自動化:實時/歷史智能分析可提供健康評分、異常檢測預測、故障根因分析等參考數據,據此執行配置優化、資源彈縮、問題定位等操作,實現邊緣運維閉環優化。
采用完整的邊緣運維解決方案,可以系統性地將核心數據中心運維與邊緣節點運維有機的結合,互相協同,讓邊緣節點發揮更大在邊緣位置所應有提供的業務能力。在5G網絡中,邊緣計算節點將給用戶帶來極致的客戶體驗,運維系統將全面將傳統靜態、以人工為主的被動式運維模式向動態、以自動化為主的主動預測式運維模式轉變,完成5G網絡應該具備的智能化能力。