壹 前言
網路服務已成為日常生活與企業營運的關鍵支撐,當使用者體驗高度依賴網路穩定性時,「零中斷」正逐漸成為被期待的基本服務水準。然而,傳統營運模式多仰賴人工監控與事件回應,往往無法即時偵測異常,亦難以應對日益複雜的系統架構與跨域維運挑戰。為因應上述需求,自治營運(Autonomous Operations)概念應運而生。其核心目標並非僅止於流程自動化,而是賦予網路系統自主感知、判斷與修復的能力,使營運模式從「反應式」走向「預測式」與「主動式」。其中,自修復網路(Self-Healing Network)技術正是實現自治營運願景的關鍵支柱,透過閉環自動化流程,大幅強化網路的韌性與可用性,進而推動零中斷營運的實現[1]。
貳 科技發展現況
一、 自修復網路營運技術
為實現真正自主且高可靠的網路營運,自修復網路需具備即時感知、主動分析、策略決策與自動修復等能力,建構一個「無人值守」的閉環運作架構。
在TM Forum的自治網路架構中,自治域(Autonomous Domain, AD)為網路自治營運的基本單元,具備感知(Awareness)、分析(Analysis)、決策(Decision)與執行(Execution)的閉環能力,如圖一藍色虛線框所示,能依技術領域(如接取網、傳輸網)、服務類型(如SD-WAN)或部署位置劃分,亦可組成複合型架構,支援跨域協作,提升整體營運彈性與擴展性[2]。
在AD架構下,自修復域(Self-Healing Domain, SHD)作為其中一種特定應用型態,專責於異常偵測與修復,具備「自我保證(Self-Assuring)」三大能力:
SHD依循標準的四階段閉環控制流程運作:
藉由這種架構,SHD不僅強化跨域的韌性與一致性,更可支援從單點自動化到全域自治的轉型。
二、 支撐自修復網路的核心技術
(1) 多層級自修復能力:從基礎設施到用戶體驗的閉環修復 實現高可靠性的自治營運,不應侷限於單一層級的修復,而應涵蓋從底層基礎設施到終端用戶體驗的多層級架構,確保異常能即時偵測、精準修復,防止問題擴散或延誤。
自修復能力可分為基礎設施、資源管理、服務管理與客戶管理四個主要層次,各自具備明確的修復任務與能力範疇:
1. 基礎設施層:涵蓋實體與虛擬資源,如交換器、虛擬網路功能(Virtual Network Function, VNF)、雲原生網路功能(Cloud Native Network Function, CNF)、虛擬機(Virtual Machine, VM)等。常見修復作為包含設備重啟、容器重建、備援切換與資源重新分配。目標是快速排除硬體或虛擬資源層級的異常問題,避免其影響到更高層級的服務表現。對應圖2的Physical/Virtual Infrastructure。
2. 資源管理層:統籌資源與服務調度,核心元件如SDN 控制器、網路功能虛擬化管理與協作系統(Network Function Virtualization Management and Orchestration, NFV MANO)與維運支援系統(Operations Support System, OSS)等。具備根據異常自動調整策略、變更流量路徑與跨域資源協調的能力,是策略落地與網路行為調節的關鍵層。對應圖2中Controllers and Orchestrators區塊(不含Service Orchestrator, SO)。
3. 服務管理層:專注維持SLA與服務可用性。當功能失效時,系統能啟動備援機制、執行流量重導,並調整資源配置,確保服務不中斷、品質不下降,即使底層出現局部異常。目標是確保用戶的服務不中斷、品質不下降,即便背後基礎設施出現局部障礙。對應圖2中Controllers and Orchestrators區塊的SO。
4. 客戶管理層:最高層級聚焦在終端用戶體驗與意圖的理解。透過收集應用行為、設備訊號與體驗異常事件,自動啟動與用戶體驗密切關聯的修復流程。此層的自修復行為,導向一種更「以客戶為中心」的邏輯閉環,也為推動意圖驅動(Intent-Driven)網路營運鋪路。
透過四層級架構設計,自修復系統得以實現從「資源層級的異常排除」到「用戶體驗的主動調整」的完整閉環修復。每一層級不僅有其獨立目標,並透過資料回饋與策略協同強化整體閉環效率。
(2) 自修復的實作策略:驅動多層級閉環修復的技術行動
為實現真正具備彈性與韌性的自修復網路,僅有分層架構與策略設計仍不足,實務上需具備可落地的技術行動與部署機制[3]。以下從三個面向探討核心實作策略:修復模式、異質環境部署與API整合,描繪自修復從概念走向應用的關鍵技術路徑。
1. 自修復的三大模式:主動、被動與混合 自修復依其觸發與應變邏輯,分為主動式(Proactive)、被動式(Reactive)與混合式(Hybrid)三種。主動式修復強調預測與預防,透過AI模型分析潛在風險,提前進行資源調整,如:光纖劣化改徑或5G切片負載預測。被動式修復則著重即時回應,偵測異常後快速執行容器重啟、VNF切換等操作,並透過閉環監控持續最佳化,如圖3所示。混合式則結合兩者優點,根據SLA與風險等級靈活調度修復策略,強化多層級韌性。
2. 部署於異質自治域中的自修復機制 自修復機制需涵蓋實體設備、虛擬化平台與雲原生架構。實體設備層可進行光纖自動改徑或路由降載,NFV環境中可實現VNF的自動遷移與重啟,而雲原生架構則依賴Kubernetes 等系統與技術達成容器修復與動態容量擴充。這些修復需具備策略驅動與事件回應能力,並整合AI引擎進行即時資源重新分配。透過整合ETSI Zero touch network & Service Management (ZSM)架構[4],可進一步支援跨網域的自動協調與意圖導向修復,提升自治網路的整體閉環效率。
3. API驅動的自動化行動與傳統系統整合 自修復架構廣泛應用API導向的控制介面提升彈性與標準化。意圖導向API (Intent-Based API)可將業務目標轉譯為具體修復行動,並依據SLA與風險情境自動觸發反應。例如:依延遲指標自動改徑、依流量預測動態擴充容量。考量多數營運環境仍包含傳統系統,透過TM Forum Open API整合OSS可實現混合式營運模式,讓常規障礙交由系統處理,特殊事件再由人員介入,逐步建構人機協作的智慧維運環境。此外,多代理(Multi-Agent)架已成為新世代管理系統設計的方向,讓系統更有彈性,也更能快速因應多變的網路環境[5]。
參 結論
隨著數位業務日益依賴連續性與即時性,傳統仰賴人工的網路維運模式已無法滿足營運所需的彈性與韌性。自修復網路技術的發展,促使營運架構轉向具備自主感知、判斷與修復能力的閉環系統,提升網路可用性並加速異常處理。
中華電信研究院積極關注自治網路技術發展趨勢,並布局自修復領域,透過打造智慧代理架構、導入網路數位分身模擬平台等核心技術,推動AI驅動營運的實質落地。具備自修復能力的網路,不僅強化企業營運效率,更為消費者帶來不中斷、高品質的連線體驗,成為邁向未來智慧網路的堅實基礎。
肆 參考文獻
[1] TM Forum, “IG1373 AN Use Cases: A Guide to Self Healing and Closed-Loop Automation,” March 2025.
[2] TM Forum, “IG1251 Autonomous Networks – Reference Architecture 1.0.1,” September 2022.
[3] TM Forum, “Self-Healing in Autonomous Networks,” July 2025.
[4] ETSI GS ZSM 000 (V1.1.1), “Zero-touch network and Service Management (ZSM); Reference Architecture,” Aug 2019.
[5] STL Partners, “The journey to a self-healing network: Intelligence, agents and complexity,” February 2025.