边缘计算ENS:拓展云的边界

云栖社区 发表于 2018-09-25 08:19:58 收藏 已收藏
赞(0) •  评论(0

边缘计算ENS:拓展云的边界

云栖社区 发表于 2018-09-25 08:19:58
+关注

(本文来自阿里巴巴云栖社区,本文只作为转载分享。)

在9月19日下午的杭州云栖大会飞天技术汇-CDN与边缘计算专场中,阿里云边缘计算团队的高级技术专家王广芳,从边缘计算的定义、场景的需求和挑战、ENS产品的价值及能力,以及典型的应用场景和案例等几个方面,详细解读了阿里云对于边缘计算的理解。

为什么需要边缘计算?

边缘计算是几年前提出来的概念,业界的定义有很多种,不过可以提炼出一个共识:在更靠近终端的网络边缘上提供服务,一个层面是在网络位置上要离终端足够近,另一个层面要在这个网络位置上提供符合边缘需求的完整的服务能力。

随着互联网的发展,业务场景趋于复杂化、创新化、快速增长和极致体验的需求,带来了架构优化和成本优化的需求,之前简单的中心-终端的架构不能满足网络性能与业务流量压力,需要中心-边缘-终端这样的多级架构。

同时,随着物联网、4G/5G为代表的新技术的发展,越来越多的智能设备连接到互联网,据IDC数据统计,到2020年将有超过500亿的终端与设备联网,这是一个非常庞大的数字。海量设备产生的数据开始指数级增长,如果这些数据处理和设备访问都直接回到云中心,将对云中心形成非常大的压力,带来网络拥塞等一系列问题,边缘计算能支撑建立一个大规模分布式的架构,让一定范围内一定比例的数据处理在边缘完成,只有必要的少量数据和访问才回到中心。

边缘计算能够提供哪些具体能力?

首先是网络低时延,空间距离的缩短带来的好处不只是传播时延的缩短,最重要的是减少了复杂网络中各种路由转发和网络设备处理的时延,整体低时延的效果明显。

其次是应对大带宽场景,通过将大流量的业务处理放到边缘完成,能够有效避免网络拥塞等问题,同时大大降低成本。

第三是应对大连接也就是高并发访问的问题,通过分布式架构分散中心处理的压力。

王广芳说道:“从这几点也可以看出,边缘计算是对中心云能力的互补,其定位一定不是取代中心云,而是要拓展云的边界,与中心云一起赋能“云-边-端”的新业务架构。云和边缘协同,是万物智联时代的基本形态。“

边缘计算应该提供什么样的服务形态?

王广芳认为,首先,边缘计算肯定不是把云的能力直接复制和下沉到边缘,因为边缘的运行环境与云中心完全不同,规模小、资源有限、而且是异构的。另外,边缘节点是分散在网络远端的,在此之上建立的是分布式业务架构,势必牵扯到调度问题。

基于这些考虑,边缘计算更应该提供一种平台能力,将底层复杂的边缘设施形态隐藏起来,将底层的计算/存储/网络基础能力,以及分布式所需的分发、调度、安全等能力标准化并开放出来,让用户能非常方便地搭建自己的边缘分布式业务架构。

现在阿里云已经有几个边缘计算领域的云产品,我们这里讨论的是阿里云在边缘基础设施这个层面上的通用服务能力的规划,也就是这张图展示的边缘计算分发平台。

在当前的边缘场景上,应用最成熟的就是CDN场景,CDN是内容分发平台,通过把内容提前缓存到边缘节点,达到内容消费的低时延和低成本的效果。对标CDN架构,王广芳所在的边缘计算团队希望把边缘计算做成一个计算分发平台,针对客户的资源需求,通过中心的资源调度为客户选择符合需求的节点资源,同时通过计算分发能力,将用户的业务逻辑打包分发到这些边缘节点上,客户的边缘业务就可以轻松运行起来。

将合适的业务逻辑下沉到边缘节点后,数据生产和消费就可以在边缘范围内形成闭环,而不必再回到中心进行处理。上图右侧是边缘节点这一层的详细架构,首先边缘计算的基础设施是建立在各类边缘节点上的,这些节点包括边缘机房IDC这样固网的节点,以及无线基站等移动网络的节点,还有更多不同资源能力和网络环境的异构的合作节点,在此之上通过ENS和LNS等软件系统,将底层复杂的基础设施形态封装起来,向上抽象出标准化的接口和服务能力。

谈到边缘计算的网络范围,王广芳说:“从距离终端最近的政企、园区、家庭这些用户侧网络边缘,到省/市/区县等不同地区的运营商网络边缘,终端到中心的网络链路还是比较复杂的,边缘计算需要在距离终端的最后几百几十公里到最后十公里内都形成覆盖和服务能力。ENS产品的目标网络范围就是中间的运营商网络,包含了固网的IDC环境,以及移动网络的MEC环境。根据ENS圈定边缘网络范围,我们能快速地确认一些目标场景,比如CDN、互动直播等。”

那么在这个圈定的范围场景上,现有业务的开展遇到了哪些痛点和挑战?

在没有ENS这样的边缘计算服务之前,客户只有一个选择,就是从各级地区各家运营商那里逐个采购节点,自建边缘基础设施,而自建基础设施会带来一系列问题和挑战。

首先,自建基础设施意味着从商务采购、服务器采购等供应链管理、到节点建设都要自己来做,导致资产投入过重和成本问题。当应对一些突发业务需求的时候,由于新建节点交付的周期长,弹性能力比较差,而临时业务高峰过后又会有很多的资源闲置。另外自建基础设施还带来运维的挑战,首先需要将边缘节点从建设、交付到运行的整个流程管理起来,其次要管理边缘节点内物理服务器层面、操作系统层面、以及软件应用层面的运维问题,出现问题时要有一组工具帮助远程查看日志和问题排查定位,这些对运维的自动化和白屏化提出了很高的要求。

另一个挑战是安全和可靠性方面,首先边缘DC基础环境的可靠性依赖第三方运营商的服务,需要应对各种复杂的情形,包括针对运营商网络割接考虑应对策略等问题。针对边缘节点中各种可能软硬件故障,还要有及时发现和调度的能力,这些要求将直接体现到业务架构的设计开发中,挑战和成本都很大。另外安全方面要着重考虑网络流量安全、主机安全等不同层面的安全问题,每个层面的安全方案开发成本都很高,比如DDoS防护,当针对某个边缘节点内IP的攻击发生时,可能整个节点的网络都出现不可用问题,而想要达到预期的防护效果,可能需要在每个边缘节点都部署一套软件加硬件的系统方案。

阿里云边缘节点服务(Edge Node Service)

边缘节点服务这个云产品,就是针对前面提到的目标场景,来应对客户自建边缘设施遇到的痛点和挑战的。ENS(简称)是基于靠近终端和用户的节点提供边缘的计算分发平台服务,使客户可以轻松地将自己业务中适合下沉到边缘的模块放到边缘运行,建立云边协同的分布式边缘架构,从而具备低时延和低成本的优势,减轻中心的压力。ENS的边缘节点已覆盖国内主要地区及运营商,可以在这些边缘节点上根据客户需求提供可动态调度的计算资源,同时支持客户将自己的业务应用软件打成镜像包分发到边缘节点上。ENS将阿里云的公共云边界进一步拓展到边缘,与公共云一起完整支撑客户“中心+边缘”的复杂业务架构需求,真正将云的基础设施能力做到下沉到用户身边。

ENS的价值和优势

使用了阿里云边缘节点服务,客户在分钟级别就完成边缘资源创建,终端到节点的响应时间缩短为5ms,同时节省30%以上的中心带宽成本。

ENS将一些自建设施的问题封装到底层,用户不可见也不需关心,使业务启动或扩容的资金大大减少,也省去很大的管理成本。其次,通过ENS的资源动态调度能力,资源扩缩容都可以在比较短的时间周期内得到满足,结合按需购买和按量付费的产品体验,在满足业务资源需求的同时充分节约客户成本。

在产品体验方面,ENS有完整易用的Web管理控制台和OpenAPI,支持计算资源的远程在线管理和计算分发管理,支持各项运行指标的实时可视化监控,以及各项用量数据的统计分析,极大提升了监控运维的能力和效率,简化了监控运维的方式。

节点的自治服务及自恢复能力是考验可用性的核心要求。边缘节点在与中心管控失联的情况下,需要能够确保节点内服务的可用性和连续性,保障基本的服务能力,同时在中心管控重新建连后,确保状态和数据的完整回传。

另外,结合资源的动态迁移调度能力,保证计算资源的高可用,同时确保对多租户进行隔离,避免资源争抢。安全方面,边缘节点支持DDoS检测、清洗以及IP黑洞防护能力。关于ENS更详细的产品介绍和产品体验,大家可以到官网了解。

边缘节点服务的典型场景及案例

王广芳现场也对边缘节点服务的几个典型应用场景和案例进行了阐述。

第一个大的典型场景类别,是业务架构对节点的覆盖有要求。这类场景以互联网行业的线上业务为主,对服务的目标范围一般是没有太多区域限制的,边缘节点也要做到全网足够广泛的覆盖。这五类具体场景是目前ENS服务的场景中比较有代表性的,能充分体现ENS服务的优势,给客户的业务带来比较大的价值提升的。

第一类是CDN,前面也讲到,CDN业务本身就是典型的边缘计算场景,可以无缝地直接跑到ENS上,我们线上这类客户对比之前的方案,在整体成本、运维能力等方面有明显的收益和提升。

第二类互动直播,主要是低时延的要求以及带宽成本节省的诉求。

第三类是在线教育和实时音视频通信,这类场景的两个特点,一是更加强调低时延,二是基本形态为端到端通信。边缘节点在这个场景中的作用是帮助客户就近接入自己的转发网络,同时提供更多可供选择的网络转发节点。

第四类是探测监控,这类业务需求主要是希望在距离用户最近的边缘,匹配真实的业务和网络环境,去探测一些业务逻辑的正确性、业务稳定性以及核心业务的性能指标等,尤其是不同目标地区涉及到差异化的业务逻辑或用户体验的情况下,能够就近模拟真实的结果。另外前面提到的实时通信,进行动态选路的前提是对当前网络节点和链路的质量有一个检测和评估,这也是一个很实际的探测的案例。

第五类是游戏加速和SD-WAN,这类场景本质是希望在边缘节点上做边缘软网关或软路由,通过网络协议和网络链路的优化,完成加速和安全等目标,边缘节点在其中起到的作用与实时通信是类似的。

第二大类的典型场景是本地化,关注的是十公里以内超低时延及大带宽业务场景,要求延时在1ms以内来满足业务需求。这类场景更多偏向传统行业或者线下业务,具有区域性的特点。比如城市大脑这类场景中的视频监控上云,新零售场景中一些店铺在视频AI及监控的自动化识别和售卖等环节的应用上云,本地行业的一些IT设施上云等,这些阿里云都在逐步形成成熟的案例。

在分享的最后,王广芳分享了他对将来ENS发展的思考。首先随着5G的到来,移动边缘计算MEC将迎来需求爆发。其次,阿里云要继续将计算分发平台的能力做升级,包括全球化的分发能力,海量节点的资源调度性能提升和体验优化,同时提供给客户更强大更自动化的远程运维能力,场景化地支持边缘运维。最后,在基础架构层面,我们也看到了AI对边缘计算的需求,阿里云正在规划支持GPU等能力,构建边缘场景的分布式数据分析平台,另外在网络的吞吐和性能方面进一步提升,来支持边缘场景中占比较大的大流量业务的处理需求。

收藏

相关话题

评论(0)

加载更多评论

参与评论

分享到

QQ空间 QQ好友 微博
取消