【编者按】 为跟踪新一代信息技术及战略性新兴产业的发展动态,中国通信企业协会发展研究中心特设“前沿技术跟踪专栏”,邀请行业专家就相关领域的核心技术、应用案例和发展方向进行分析解读。
基于电信新型城域网的确定性网络
1、确定性网络背景与概念
随着互联网与实体经济深度融合,全球互联网已由消费型向生产型转变,“尽力而为”的传统网络架构难以支撑未来业务对差异化服务、确定性、低时延的需求。为适应未来全球网络变革的新趋势,解决互联网当前所面临的核心技术问题,满足未来业务对网络时延、抖动、丢包等服务质量的需求,确定性网络在最近几年中逐渐发展起来。
确定性网络(Deterministic Networking)技术可以在传统以太网物理介质的基础上,为多种业务提供端到端确定性服务保障,具备确定带宽、确定时延、确定抖动、确定丢包率等特点,是一种能够提供确定性服务质量的新一代网络技术。
确定性服务质量(Quality of Service,QoS )可以提供“准时、准确”数据传输服务质量。 五种典型的确定性 QoS包括:低时延(上限确定)、低抖动(上限确定)、低丢包率(上限确定)、高带宽(上下限确定)、高可靠(下限确定)。确定性网络的特征是能够提供确定性服务质量,灵活切换确定性服务和非确定性服务,自主控制提供确定性服务质量的等级,全面赋能产业升级,支撑大规模机器通信、机器视觉、远程操控、人工智能、工业互联网、智能服务业的需求。对于运营商来说,需要具备深入产业一线,定制化弹性供给确定性网络服务的能力。
2、确定性网络的技术体系及演进趋势
2.1确定性网络的技术体系
通过近几年的理论研究和实践探索,确定性网络技术框架逐渐成熟,形成了以FlexE、TSN、DetNet、DetWiFi、5GDN为核心的技术体系,适应不同的应用场景。
图1 确定性网络技术应用场景
FlexE技术
FlexE也称为灵活以太网,是由 OIF(Optical Internetworking Forum)发布的通信协议。 FlexE在以太网MAC层和物理层之间的中间层增加了FlexE Shim层,通过时分复用分发机制,将多个client接口的数据按照时隙方式调度并分发至多个不同的子通道,使网络具备类似于时分复用(TDM)的独占时隙、隔离性好的特性,又具备以太网统计复用、网络效率高的特性。
TSN技术
时间敏感网络(简称TSN)是IEEE 802.1 TSN工作组制定的一套协议标准。TSN标准定义了以太网数据传输的时间敏感机制,在时间同步、流管理、流控制和高可靠无缝冗余等方面进行了统一扩展,为时间敏感型业务提供低时延、低抖动、高可靠的传输服务,并支持多业务流在同一网络内的高质量传输。TSN作为通用的底层架构,可实现异构性网络的实时性数据交换,能够在标准以太网络上建立分布式、可同步化的硬实时(Hard Real-Time)系统。TSN技术遵循标准的以太网协议体系,天然具有更好的互联互通优势,可以在提供确定性时延、带宽保证等能力的同时,实现标准的、开放的二层转发和流量调度,具有统一的时间同步机制和灵活的网络管控能力,使更多企业可以在其架构上实现生产控制技术(OT)与信息技术(IT)的融合。
DetNet技术
IETF在2015年10月成立DetNet工作小组,专注于在第二层桥接和第三层路由段的确定性数据路径,这些路径可以为三层数据提供确定性的延迟、抖动、丢包以及高可靠性保障。DetNet目标是在第二层桥接和第三层路由段上实现确定传输路径,这些路径可以提供时延、丢失分组和抖动的最坏情况界限,以此提供确定的时延。相比于TSN,DetNet的工作范围更加广泛,通过MPLS/IP技术,以实现三层的确定性传输期。
DetNet 网络架构通过资源(如链路带宽和缓存空间)预留、冗余保障,为DetNet 提供了可靠的确定性服务。未使用的预留资源可以用于非DetNet 数据流的传输,实现不同优先级业务流共网传输。
DetWiFi
目前,广泛应用的工业无线技术主要包括 WirelessHART、WIA-PA、ISA100.11a等。然而,这些技术不能同时满足工业控制所需的极低时延和高可靠性通信。因此IEEE推出了IEEE 802.11ax/IEEE 802.11be,对原有的IEEE 802.11无线协议进行改进,增强其可靠性和实时性,引入了相关确定性关键数据传输增强功能,适配时间敏感的高速工业应用。DetWiFi由三个组件组成:数据包队列,任务调度程序和系统状态容器。
5GDN
5GDN(5G确定性网络)是指利用5G网络资源打造可预期、可规划、可验证、 有确定性传输能力的移动专网,提供差异化的业务体验。相对于传统“尽力而为”的公众网络,5G确定性网络通过叠加使用一些网络新技术来提升和保障网络的质量,在复杂多业务接入和高效传输的情况下,提供端到端确定性的网络服务,满足一些行业应用对网络的严苛要求。5G标准化组织3GPP正将TSN、DetNet等技术逐步迭代集成到5G网络中。
5G确定性网络架构如图8-2所示,包括确定性网络调度与控制中心和确定性服务管理功能。两者进行双向协同,共同支持5G确定性服务。确定性网络调度与控制中心担当确定性网络控制器的角色,通过统筹协同调度网络各域,实现多技术综合集成、网络应用双向协同、SLA/QoS实时评估,最大化网络整体确定性能力。确定性服务管理功能支持管理客户或运营商业务需求、管理网络切片/5G局域网/边缘计算等系统的能力,此外还提供顶层确定性的设计部署、确定性能力建模、确定性生命周期管理、支撑实时SLA/QoS仿真和预测。
图2 5G确定性网络架构
2.2确定性网络的演进趋势
目前来看,确定性网络的演进大致可以分为三个阶段,具体如下:
第一阶段:实现单个管理域网络内的确定性传输。此场景内,目标流和背景流模型简单可控,目标流特征单一,追求大吞吐量下的无丢包、低时延转发。
第二阶段:实现与普通业务流共网传输,完成低成本、高效率、高可靠的端到端传输质量保障。此场景内,背景流呈现流量动态、链接海量的特性,且网络设备形态异构。
第三阶段:在商用级大网范围内,多种确定性技术同网共存,针对业务需求,为端到端应用和业务提供分级、分层的定制化、差异化服务质量保障。
3、基于新型城域网的确定性网络
3.1新型城域网中确定性网络的实现
新型城域网基于SRv6技术完成业务承载,可基于DetNet技术实现确定性网络的极低丢包和可承诺的时延上限。DetNet是一系列技术的合集,包括了很多相对独立的单点技术,这些单点技术的结合,可以形成完整的解决方案。
资源分配:在统计复用的网络中,拥塞是造成分组网络时延不确定以及丢包的重要原因。DetNet依靠资源预留和队列管理算法来避免高优先级报文之间的冲突,避免网络中出现拥塞,同时提供可保证的端到端时延上限。资源预留可以在中间设备为不同的流量预留出端口资源,队列管理算法可以调度可能发生冲突的报文,两者相互配合可以达到避免拥塞的效果。
显式路径:为了保证业务的网络质量稳定,不受网络拓扑变化的影响,确定性网络需要提供显式路径,对报文的路由进行约束,以防止路由震荡或或其他因素对传输质量的影响。SRv6 TE Policy提供了该功能,只在源节点维护流的转发状态,中间网络节点无需维护逐流的转发状态,只需按照当前的SRv6 SID的指示进行转发即可。
冗余保护:冗余保护的基本原理是为确定性数据流建立两条或两条以上不重合的路径,同时传输复制的报文,冗余报文到达汇聚节点会根据报文中携带的报文编号转发先收到的报文,丢弃冗余报文。冗余保护可以规避传统路径保护中主备倒换过程中丢包的问题,在网络出现链路故障时,进行无损倒换。
3.2基于SRv6的冗余保护
在新型城域网中,基于SRv6实现确定性流多发选收的冗余保护机制可以保障数据传输的高可靠性。多发选收就是报文在入口PE 设备复制成多份,走两条路径转发,到出口设备时选收成一份,然后发出。基于SRv6的多发选收工作过程如图3所示。入节点封装包含SRH1的外层IPv6报文头,其中SRH1指示入节点到复制节点的路径信息。
图3 基于SRv6冗余保护报文转发过程
复制节点对确定性流进行复制,并为复制报文分别重新封装包含SRH2和SRH3的外层IPv6头,SRH2和SRH3中携带流标识和报文的序列号。SRH2和SRH3分别指示从复制节点到汇聚节点的两条不重合路径信息。
汇聚节点接收到报文,根据报文SRH中的流标识和序列号判断报文是否为冗余报文,先收到的报文会被转发,后收到的报文被判断为冗余报文,然后被丢。被转发的报文重新封装包含SRH4的外层IPv6报文头,指示从汇聚节点到出节点的路径。基于SRv6实现确定性流多发选收的冗余保护机制,这一机制可以保障数据传输的高可靠性。
3.3基于SRv6的确定性时延
确定性网络的主要目标之一是提供确定的时延,需要有确定的时延意味着需要把抖动控制在一定范围内,不可以随着设备跳数的增多而不断累积。广域网的抖动增大主要来自于网络设备内的微突发。如图4所示,当存在多个入口的报文需要转发到同一出口的场景中,可能出现多个流的报文同时到达节点A,在出接口排队等待调度的场景,Qos策略无法规划每个流的到达时间,也就无法保证确定性的时延,这就是微突发。如果下游节点也存在类似的现象,则微突发会进一步累积,多跳之后,抖动会加剧。
图4 时延不确定产生的原因
CSQF(Cycle Specified Queuing and Forwarding,循环指定队列和转发)就是用来解决该问题,CSQF以时间为单位进行资源预留,它通过控制器的计算来指定报文在每一跳的出端口时间,可以精确地规划流量、避免拥塞。CSQF核心是引入周期调度的概念,控制器需要维护全网的流量状态并预计占用端口时间,当有新的传输请求时,它会计算一条满足用户时延需求的路径,并规定流量在沿途设备上的出端口时间,通过SRv6的显式路径安排好确定性流的转发路径和在各节点的调度周期/时间,实现了确定性时延。
图5 CSQF周期调度示意图
如图5所示,确定性网路需要转发一条确定性流,控制器需要事先收集网络拓扑信息和路由器转发报文的时间周期信息,控制器完成路径规划时间周期规划后,将相关信息下发给路由器,路由器根据控制器下发的信息执行报文转发动作:
步骤1:根据SID信息,确定性报文在 RA的T0周期内被发送出去
步骤2:RB收到确定性报文,阴影区间是微突发和链路突发等导致的RB可能收到确定性报文的时间段(也就是抖动)
步骤3:RB并不是在收到确定性报文时(阴影区间段)就立即调度发送给RC,而是在根据SID信息(RB.T1),做了时间预留,在T1周期内,将报文发送出,这是CSQF的关键点。
CSQF通过全局规划的周期调度,能保证确定性流的传输时延抖动在2个周期以内;且抖动并不会随着跳数增多而增大,这就实现了报文的确定性时延。
4、确定性网络应用场景
4.1工业互联网场景
工业互联网应用场景广泛,目前已延伸至40余个国民经济大类,涉及原材料、装备、消费品、电子等制造业各大领域,以及采矿、电力、建筑等实体经济重点产业,形成了千姿百态的融合应用实践。基于数字化技术的智慧工厂,将生产、设计、制造等环节与互联网、云计算、大数据、人工智能等新技术融合,具有广泛的推广应用价值,将有效推动工业互联网与制造业深度融合,促进制造向智造升级,助力制造业高质量发展。
工业互联网分为外网和内网,内网又分为IT网络和 OT网络。 OT网络分为现场级网络和工厂车间级网络。如图8-3所示,现场级网络是负责 PLC(可编程逻辑控制器)、 I/O(输入/输出)子卡、传感器和执行器的连接,工厂车间级网络负责 SCADA(监测控制和数据采集系统)和 PLC 的连接。
图6 工业互联网内部结构图
当前OT网络发展改造,其中一个重要的措施是PLC云化。而 PLC 和I/O子卡之间的通信,对时延抖动有较严格的要求,是PLC云化的重大难点。从工业控制使用场景来看,不同业务场景时延要求不同。如物料传送,一般要求循环周期在100ms级别;如机床控制,一般要求循环周期在10ms级别,抖动小于100us;而一些高性能的同步处理,则要在1ms级别,抖动小于1us。
对于上述工业场景差异化的时延和抖动要求,使用现有的IP网络无法满足传输需求,当运营商在城域网中部署了确定性网络以后,很好地解决了承载的问题,促进了PLC的云化。这样海量现场级工业数据都可以通过云化PLC系统获取并存储在云上,方便和SCADA,甚至是IT网络中的系统进行数据传递和交换,实现了工业大数据分析能力。
图7 基于确定性网络云化PLC结构演进
4.25G确定性承载场景
随着5G的快速发展,各个行业也借助5G技术推进本行业的数字化进程,包括:电力、交通、金融、教育、医疗、矿山等。各个行业存在多种业务场景,不同业务场景对转发时延确定性要求不同。有些业务场景对业务报文的转发时延确定性有比较高的要求,用传统IP转发技术难以保证。
为了满足“5G+垂直行业”的各类确定性业务的通信需求,5G网络需提供端到端的确定性能力。5G端到端确定性网络包括确定性的核心网、确定性的无线网和确定性的承载网络。
图8 5G承载网结构示意图
5G确定性承载网络主要完成基站BBU到5G核心网设备间的数据传输和接口连接功能,包括了基站到核心网UPF间的用户面接口 (N3)和基站到核心网间的控制面接口(N2)。5G承载网络除了面临4G承载网络需要应对容量、可用性、部署成本等问题,还面临两个额外的挑战,包括超低时延传输以及高密度接入。通过在承载网络上部署FlexE以及基于SRv6的确定性承载技术,可以实现确定性流和非确定性流的隔离,并保障确定性流的可靠性和时延的稳定性,从而提供对关键业务确定性的承载能力。
(本文由新华三技术有限公司资深解决方案架构师章权明供稿)