基于静态分类的系统测试广域网通过的对等链路

SDNLAB 2022-11-03 774

描述

本篇文章由布朗大学和微软的研究者合作完成。在本篇中，他们提出了一个基于静态分类的系统，用来预测一个流进入广域网（WAN）时会通过的对等链路（peering link）——TIPSY。

背景

在实际中，大型云和内容提供商通常会使用对等链路连接广域网和其他网络。这些运营商必须要时刻注意对等链路中断，提供充足的流量速率来避免拥塞（congestion）。目前来说，网络管理员很难通过BGP提供的方法控制流量进入网络时通过的路径，因为例如MED和ASpath属性都是粗粒度和启发式的，往往会被AS给忽略。其中在WAN中缓解拥塞的一种方式是有选择地撤销对邻居的路由宣告来使得流量能够被重新分配到具有空闲capacity的路由器。

广域网

设计

但是，盲目地撤销路由宣告有可能会扩大拥塞的范围，因此在本文中，作者使用TIPSY来预测给定流量最有可能经过的对等链路。在设计算法时，作者的目标是高准确度，低代价和高推断速度。在模型训练的过程中，作者首先通过那些具有更加具体特征的模型来训练，这些模型往往会被记录得更细节，也就是说模型中记录的具体的流对于未来的分配更有指导意义；在此之后，通过迁移学习从具有较少特征的模型上进行学习。这些模型的参考价值往往是对于一个流，如果它与另一个流相似，那么对它的操作也许会与对另一个流的操作相似。整个执行过程是拥塞缓解系统（congestion mitigation system）周期性地寻找拥塞事件，当它寻找到相应事件之后，它会向TIPSY传递可能撤销的通告候选者（candidates）和可能会被影响到的一组流。在此之后TIPSY会告知会被影响到的MIN、MAX、LIKELY peering flow，之后系统基于这些信息决定是否进行路由通告撤销。

性能评估

本文将TIPSY部署至Azure WAN后，证明了当在进行了路由通告撤销后，TIPSY预测3条会接收到最多流量的对等链路的准确率不低于76%。与此同时，TIPSY可以被用来分析单个对等路由、单个路由器或单个站点的中断风险，或者通过de-peering来降低那些使用量较小的peer的开销。

个人观点

本文创新性地将网络路由决策与深度学习相结合，对广域网的路由撤销提供了一个非常有趣的解决方案。但是我想要知道在进行路由撤销时，TIPSY是否能够支持较小粒度的撤销。例如对于给定的/10的网络，能否将撤销范围减小至/24甚至更小，这样较小粒度的撤销范围个人感觉对整体网络的变动不会特别大，也能尽可能保证网络的稳定性。

Network Entitlement: Contract-based Network Sharing with Agility and SLOGuarantees

Satyajeet Singh Ahuja, Vinayak Dangui, Kirtesh Patil, Manikandan Somasundaram, Varun Gupta, Mario Sanchez, Guanqing Yan, Max Noormohammadpour, Alaleh Razmjoo, Grace Smith, Hao Zhong, Abhinav Triguna, Soshant Bali, Yuxiang Xiang, Yilun Chen, Prabhakaran Ganesan, Mikel Jimenez Fernandez, Petr Lapukhov (Meta Platforms, Inc.), Guyue Liu (New York University Shanghai), Ying Zhang (Meta Platforms, Inc.)

背景

这篇文章由Meta研究发表。本文介绍了Meta为了应对数据量爆炸增长，共享网络会导致流互相影响，容量不足、行为不端的服务增多等问题，提出的生产型广域网(WAN)的授权解决方案。其中，在Meta的服务对象中，存在不同的QoS等级以及不同的流量模式。同时，行为不当的服务导致中断服务的网络需求增长速度快得多，大约比我们的网络建设能力快30\%，而网络建设能力从根本上受到日益稀缺的光纤资源的限制。由于以上问题的出现，需要一种有效规划、管理和运营共享网络资源的新解决方案。

设计

框架包括两个关键部分: (1)一个网络授权系统，该系统建立一个敏捷契约来同时实现网络效率和长期的SLO保证;(2)一个在生产流量上执行合约的，大规模分布式实时执行系统。授权合同(Entitlement Contract):授权合同是网络团队与服务团队各网络产品组(network Product Group，简称NPG)之间达成的协议。授权包括以下四个步骤。预测服务需求，主要包含两个部分，有机变化（和时间相关的变化）和无机变化（除有机变化外的其他变化），系统主要对这两部分进行预测。使用基于软管的合同表示，关键思想是将给定软管分成两个或多个分段软管，每个分段覆盖部分目标区域的子集。合同批准，包含两个批准过程，实现长期SLO保证，以及实行强制的优先级，其实现过程如下图

广域网

最后对当前期间的已批准合同需要在生产流量上强制执行。其强制执行通过实现分布式的带宽管理器系统完成，如下图所示。在分布式系统中，我们的终端主机只将数据包分类并标记为不同的类，即合格或不合格，并将最终的决定留给硬件交换机，这个操作简化了终端代理，因为它只标记流量而不是塑造流量，所需的资源要少得多。

广域网

其中执行代理由一个用户空间组件和一个内核组件组成，如下图所示。用户空间组件负责查询集中式合同数据库并监控流量率，并标记不合格流量。内核组件将相应操作应用于流量上。我们使用伯克利包过滤器（BPF）程序来完成。所有操作被编程在BPF映射中，BPF程序查询在出口期间这些映射，并将相应的动作应用于流上

广域网

实验评估

文章每隔几个月对生产现场流量进行一次演练测试，以确保运行时强制系统的正确性。其选择了最大服务之一的Coldstorage作为测试服务。其收集了网络级和应用程序级统计数据。网络级统计数据包括数据包丢失、流量速率、往返时间（RTT）和TCP统计数据等。应用程序级统计数据包括读取延迟、写入延迟和块错误。结果如下图。可以看出该系统能够在高效利用网络的情况下，确保合格流量的性能。在应用表现上，读延迟小，写延迟大。

广域网

个人观点

我认为这篇文章要点在于使用了网络授权系统来同时实现网络效率和长期的SLO保证。由于Meta公司具有大量的数据量和应用需求，它能够根据实际用户的需求进行详细的系统设计和优化。使用分段软管的方式增强了整个系统的灵活度。实验方面也在实际的场景中运行，考虑维度较齐全。同时，文章最后也根据数据发现提出了一些相关领域的一些问题，给其他科研者进行参考。我个人比较好奇在于这样的协议在其他的大型数据中心网络中，是否也能达到好的效果，也就是这个算法设计的适用性如何。

SDN in the Stratosphere: Loon's Aerospace Mesh Network

Frank Uyeda, Marc Alvidrez, Erik Kline, Bryce Petrini, Brian Barritt, David Mandle, Aswin Chandy Alexander (Loon LLC)

背景

本文主要介绍了在三大洲使用Loon网络的三年运营经验。谷歌于2011年成立Loon项目，目的在于为世界上未被网络连接服务的地区提供连接，其首次部署的服务目标是最大限度地提高在肯尼亚39334平方公里农村地区的4G LTE数据覆盖率。由于部署成本高，收入潜力有限，传统的运营商几乎没有动力为边远地区的低密度人群提供网络服务。由于在这些地区部署地面LTE蜂窝塔十分昂贵，Loon项目通过在漂浮于距离地面15-18公里的气球上部署扇形天线和基站，为没有办法进行网络连接的人群带来负担得起的网络连接。

设计

项目中Loon面临着气球的运动和位置，可用电源，无线电收发机性能，以及协调网络结点等挑战。为了应对上述挑战，Loon开发了一个名为“Minkowski”的时空SDN控制器，负责集中规划和启动回程网络。除了路由等其他传统SDN功能外，TS-SDN还负责确定无线电资源分配和无线链路选择。TS-SDN的核心是能够模拟物理世界的三维几何结构和射频传播，从而预测节点移动和大气条件随着时间的变化。其在Google数据中心运行，通过控制数据平面接口（CDPI）向网络节点发送更新和计划，以此来确定网络。具体的逻辑数据流如下图。

广域网

由下图可以看出，链路重新配置是有风险的，因为它们经常失败，恢复成本很高。Loon的经验表明，将物理世界的模型纳入TS-SDN的逻辑网络规划，与严格的反应式方法相比，在5分钟内恢复的路线的平均恢复时间减少了37.8%。文章偏向于选择高效用链路，并通过偏向于保持已建立链路的拓扑来降低变化率。同时，文章提出，MANET路由协议在适应拓扑变化方面非常有效，考虑到中断倾向和潜在的长恢复时间，建议网络工程师考虑将预测方法纳入NTN协调。

广域网

为了回程数据，Loon采用了混合网络控制平面来平衡性能和可靠性，同时组织了一个移动的点对点无线链路网状网络，将气球相互连接并连接到地面基础设施。混合网络控制平面： TS-SDN控制器使用三个控制平面的层次结构配置气球路由器，如下图。

广域网

每个气球控制平面层的能力都比前一层来得高，命令延迟从几分钟下降到几毫秒。然而，随着能力的提高，可靠性下降。气球0层：Satcom。为了将断开的气球引导到网络中，最底层的控制平面使用了两个商业卫星网络。TS-SDN在计算了未来一段时间的拓扑后，将联系卫星消息中继服务器，并传递一个气球节点与另一气球或地面站建立连接所需的最小信息量。气球层1：MANET。一旦建立了链路层连接，Loon就使用基于AODV的协议batman-adv来传递控制平面消息。自组织路由域从地面站延伸到气球，并在连接的气球之间延伸。气球层2：SDN。网络体系结构和TS-SDN使得气球中的站点能够对带内数据平面进行编程，以响应来自节点管理和LTE控制应用的请求。网状网络：使用移动的长距离定向点对点天线网状网络带，几乎所有元素都会随时间变化，这些元素必须被显式建模或检测。系统需要在其观测值与建模条件相矛盾时进行检测和调整。面对短时间尺度的变化，Loon在TS-SDN中模拟运动，并在未来的特定点执行命令，使其能够使用预测的指向向量和预期的信号强度。

难点

最后，文章提出对Loon的可解释性依旧存在困难的地方，由于对时间和空间动态过程结合的需要，TS-SDN的使用是必要的，这同时也导致难以对结果进行推理。有三个主要方面：1）系统的状态如何？2）系统是如何达到这种状态的？3） TS-SDN为什么选择这种特定的拓扑配置？通过建立查看日志，我们可以尝试回答前面两个问题。对于第三个问题，虽然求解器有确定性，但它是迭代的，并且依赖于大量异步数据源，它的拓扑解是时间相关的。文章也同样提出了一些解决该问题的观察和建议。可视化系统的建立有助于了解网络的当前状态，但需要改进求解器，以将单个命令与计划的拓扑相关联。

个人观点

Loon项目是一个关注边远地区的大型项目，我相信这个项目的建立一定给该地区的人群带来了巨大的网络上的变化，使用科技带来非常实际有利的影响。在具体实现方面，我认为通过使用气球部署基站，避免边远地区地理限制的问题是一个创新点。并为了解决移动基站的问题，提出建立移动的网格网络。同时在TS-SDN控制器，引入物理模型进行建模和预测，也是与实际问题适配的有效解决方案。文章最后，也对当前项目的不足提出了想法。由于个人水平有限，对整个系统还未有更深入的理解。该项目在未来的优化和使用情况也令人十分关注。

Software-defined Network Assimilation:Bridging the Last Mile Towards CentralizedNetwork Configuration Management with NAssim

Huangxun Chen (Huawei Theory Lab), Yukai Miao (University of New South Wales), Li Chen (Zhongguancun Laboratory), Haifeng Sun (Beijing University of Posts and Telecommunications), Hong Xu (Chinese University of Hong Kong), Libin Liu (Shandong Computer Science Center), Gong Zhang (Huawei Theory Lab), Wei Wang (HKUST (Guangzhou)

本文由华为理论实验室和中关村实验室以及北京邮电大学、香港中文大学等多所高效合作完成。文章提出了一种智能高效的将异构网络设备（例如，遗留设备和来自新供应商的设备）引入现有集中控制SDN网络的架构NAssim。

背景

将异构网络设备引入现有集中控制的SDN网络的的过程定义为软件定义的网络同化(SNA)。SNA对网络操作(NetOps)团队来说是一个痛苦的问题，因为需要大量的专家经验来弥合新设备的配置模型和SDN控制器中的统一数据模型之间的差距。目前的SNA方法需要大量的人力努力，而且容易出错。因此，作者提出了NAssim，用于帮助NetOps加速吸收一个新设备到SDN网络的过程。

挑战

1）人工配置的差异性：设备的用户手册是提取其配置模型的最可靠的来源，特别是对于只有命令行语句的遗留设备。然而，不同的供应商会对自家的用户手册进行组织和格式化。因此，我们需要一个统一的解析框架来从手册中提取配置模型。 2）配置错误和歧义：用户手册是唯一学习来源，但仍然会包含许多错误和歧义，即设备实际行为可能手册中没有完全说明，因此仅从手册进行解析是不够的。为了验证和正确所解析的模型，我们必须寻找一种有效的方法来识别潜在错误和修正歧义。（这一点Hoyan也提到过，修正方法类似，通过实际部署结果来调整学习模型） 3）配置模型之间的异构性：不同供应商的配置数据模型是不同的。将它们映射到UDM是一项具有挑战性的工作，而且，我们认为，必须涉及使用自然语言处理(NLP)技术来从用户手册中的CLI命令的自然语言描述中学习。

设计

NAssim的架构包含一个统一的解析器框架：来解析不同的设备用户手册到初步配置模型；一个严格的验证器：验证模型的正确性通过正式的语法分析，模型层次验证和经验数据验证；以及一个基于深度学习的映射算法：使用最先进的神经语言处理技术来产生经过验证的配置模型和SDN控制器之间的人类可理解的推荐映射。宏观上来看，NAssim通过直接从设备手册中学习配置规则，从而生成SDN控制器和人类专家都能理解的数据模型，从而将网络管理者从繁琐的程序操作任务中解放出来。

广域网

讨论

NAssim的设计是由于网络配置管理中的实际挑战。大多数企业级网络具有多供应商的性质，在目前的NetOps实践中，通常在上层网络功能（北向）和异构网络设备（南向）之间设有一个软件定义的控制器。SDN控制器的南下方向使异构设备对北上方向透明。例如，如果一个网络功能需要更改BGP协议的AS number，控制器应该执行统一的正确的配置命令将更改应用于目标设备上，即修改行为希望是供应商无关的。而这需要大量学习多供应商的设备配置模型到中央控制器中。NAssim也是试图加速和高效化这一过程。从更广泛的角度来看，网络同化背后的基本研究问题是识别网络设备之间的语义等价性。NAssim是在软件定义的网络集中式配置管理上下文中解决这个问题的初步努力。简而言之，NAssim的目标是识别在控制器中的多供应商设备模型和统一设备模型之间具有等效配置效应的命令和参数。此外，在传统路由器/交换机网络之外的其他网络场景中，处理异构化统一网络范式也是一大趋势和具有研究意义的方向，即物联网网络中的语义互通性。

个人观点

网络同化是大规模网络管理中难以避免的一大难题，该文章针对此问题在集中式控制场景下提出了一套高效网络管理范式，有效解决了异构设备的融合困难。现阶段各厂商在设备功能上对网络协议的实现只需遵循语义一致性，而其使用的数据模型结构上存在很大差异，这样的异构设备间的语义转换极大程度依赖于人的理解，且耗时耗力。所以该文章不仅在智能化异构网络管理上利用人工智能模型有效减小了管理难度，还着重讨论了网络统一化范式的趋势，这个一个有意义且能有效提高网络智能管理水平的方向，这不仅对网络同化有益，更对于网络验证，诊断和修复问题都有助益。

A Case for Stateless Mobile Core Network Functions in Space

Yuanjie Li, Hewu Li, Wei Liu, Lixin Liu, Yimei Chen, Jianping Wu, Qian Wu, Jun Liu, Zeqi Lai (Tsinghua University)

本篇文章由清华大学网络科学与网络空间研究院和北京信息科学与技术国家研究中心的研究者合作完成。在本篇中，作者讨论了推动移动核心网络功能进入近地轨道(LEO)超级卫星星座( satellite mega-constellations)的价值和通过无状态移动核心网络(stateless mobile core network)实现这个目标的方法。

背景

虽然移动网络的受众已经十分广泛，但它们在偏远地区和特殊地域的覆盖面还是很窄，使用者也很少，部署这些网络的地面基础设施也容易遭到自然和人为因素的破坏。因此将移动网络推向太空似乎是一个有可能的解决方案，目前运营商和电信业也开始尝试使用移动卫星和高层次功能(high-layer)的卫星。即便如此，将移动核心功能推向太空仍有争议，因为目前的5G网络功能主要是为领土用途设计的。研究表明，与固定的地面基础设施不同，这些数据业务无法在太空中良好运行，低轨道卫星在不可靠、不可信的外层空间的全球范围内快速移动，这对如今的有状态的移动核心网络功能造成了挑战，面临着空间-地面不对称性的瓶颈、触发快速移动的服务区，从而耗尽静态UE的信令成本、不可靠外太空带来的敏感状态的泄漏和故障。

设计

作者认为，上述问题都根源于5G的有状态移动核心网络功能设计。因此，他们提出了一个无状态的、去中心化的、轻量级移动核心网络功能。他们提出了SpaceCore这样一个解决方案，保留用于流量交付、移动性、QoS的运营商级别的服务和解决了功能状态解耦后的计费和安全问题。 SpaceCore由远程地面家园( remote terrestrial home)、作为分散核心的低地轨道卫星和UE组成。远程地面家园是一个传统的移动核心，运行所有的控制功能。它将空间基础设施与传统的地面移动网络无缝整合在一起;允许运营商在推送核心功能时保留其完全控制权以及作为向UE推送会话状态时的信任源。分散的联网卫星将数据功能和网关从远程地面站推送至边缘，从而消除了空间-地面不对称的瓶颈。卫星可以通过卫星间链路（ISL）转发数据和信令流量。SpaceCore将会话状态与卫星的数据功能解耦。卫星在会话建立或移动事件中直接从本地UE中获取状态。

广域网

性能评估

使用公开的可操作5G和卫星数据集(operational 5G and satellites datasets)在可扩展性、性能和对攻击的复原性上对SpaceCore和四个卫星解决方案进行了比较评估。结果显示SpaceCore相比与其他解决方案对信令成本降低了一至两个数量级，通过转移到地理空间服务区来减少状态迁移，并通过设备即存储库( device-as-the-repository)来实现状态的本地化管理，以减少故障/攻击。

个人观点

卫星网络也是网络领域的一个热门话题，因为我认为这不仅关系到每个国家人民的生活质量，也关系到每个国家的军事水平，甚至对全世界的发展都能够产生深远的影响。这篇文章提出的一个背景其实就是目前5G的盛行。之前5G对我来讲也许仅仅是移动设备上传下载速度的显著增强，在了解了这篇文章的工作之后，才明白对于太空网络领域5G也有着十分重要的作用。但就目前来说，文章中提到5G虽然也开始拓展对于卫星的支持，但其架构由于“向后兼容”的要求不会发生显著的改变。因此，对于低地轨道超大型卫星的发展来说，5G及以后的本地无状态架构将是十分必要的。审核编辑：郭婷

打开APP阅读更多精彩内容