「阿里云」李克:边缘计算的发展趋势与挑战

2021-02-18 10:51:51来源:亚太CDN产业联盟 热度:
为期两天的Distributed Cloud|2020全球分布式云大会,为5G商用时代的到来,在新一轮云计算技术变革的关口,呈现出分布式云生态全景,影响2021年分布式云战略科技趋势,共享新商业引擎,共寻亿万级苍穹,开创未来新篇。
 
在12月17日下午举办的“边缘计算”论坛上,围绕边缘计算行业的发展背景、技术挑战、阿里云边缘计算产品以及对未来的展望等话题,阿里云高级技术专家李克带来了题为《边缘计算的发展趋势与挑战》的精彩演讲。
 
 
李克首先对计算机计算的发展史作了回顾,在过去的20年,计算模式实现了一个轮回:
 
早期公司或者是客户主要是自己租用IDC资源,自己部署业务,这时使用的是分布式的IDC的机房,也是最早的边缘场景,出现了最早的边缘计算产品——“CDN”,可以说边缘计算是CDN的基座,CDN是边缘计算上层的应用。
 
最开始大家使用CDN机房的时候业务规模都会增长,当你用户也有规模增长的时候,单一的IDC的机房很难应对流量的增加和并发增加,这时云计算随之出现。最近边缘计算随着5G、IOT的发展,又成为了技术关注的焦点,背后原因是场景的要求以及对成本的诉求。首先在场景方面,5G的特征是大带宽、低延时、大连接,是数据连接不可能承接大爆发的场景,这使得中心已经出现了流量颠倒的情况,上下带宽不像以前那样,现在上传的部分数据已经开始超过下行的带宽了,对中心来讲其实很难承载比较大带宽的场景要求。
 
而混合边缘节点大量提供的是类似CDN的业务,这种业务的模型是晚高峰占用资源,其他时段的资源是空闲的,这时在大带宽的场景下可以分用边缘的资源。对低延时的场景,比如工业制造、云游戏是很难直接使用这个方案的。对大连接来讲,类似物联网和智能交通有非常多的设备需要连到云计算,这时就需要有更多的边缘节点承载这些设备。
 
这时边缘计算就出现在中心云和终端之间,起到了承上启下的作用,把中心云的数据或者是服务向端下发,把边侧上行的数据进行接入,最终跟中心云形成互联互通。未来会有80%以上的数据和计算发生在边缘,边缘计算将做为云计算的补充,和中心云计算协同起来赋能各行各业。
 
边缘计算出现的因素是承载,客户使用云计算关注的是成本、质量、稳定性,成本起到很重要的作用,中心云的流量已经颠倒了,边缘上的空闲资源包括空闲的CPU怎么高效的复用可以解决成本上的问题?有一个城市云大脑的项目,分析成本构成的时候,有一半以上的成本都是带宽类的成本,也就是数据中心BGP的带宽非常高,如果把项目当中的数据大量地在边缘上进行处理、卸载,在边缘上计算,通过降低数据中心的数量可以有效降低成本的。
根据测算,如果数据可以压缩到5%,项目成本可以节省一半以上。
 
另外,成本可以促进边缘计算的发展,边缘计算也不是完全可以取代中心云计算的,两者一定是相辅相成互相协同的关系。中心云可以提供大规模的节点部署,可以非常强的弹性以及有很强很好服务的SLLA,但是离客户的终端是比较远的,边缘云是分布式的节点,离客户比较近,但是节点的规模很难做到非常大,我们在极端的情况下有单服务器节点的情况。因此,中心和边缘是一起解决5G场景,一方面是面向应用场景,另一方面是面向垂直的行业。
 
在介绍了整个边缘计算发展的历程和背景之后,李克提到了边缘技术面临的挑战。
 
首先,边缘计算由于节点是分布式的,部署在很下沉的三四线城市,节点的网络环境、服务器机型是各种各样的,整个边缘节点的基本稳定性比不上中心,边缘计算要基于边缘的不稳定性搭载服务,首先在资源管理上无论是节点的架构、网络架构或者是节点的服务器架构是有各种各样的,现在边缘计算场景非常多,传统的X86的服务器不能完全满足,会出现很多异构的资源像GPU的资源和服务器的资源进行虚拟化和管控也好,有各种各样适配的工作,整个资源管理是非常复杂的。
 
第二,在资源的使用上,中心云的方案是很难直接下沉到边缘使用,一方面是中心云有大量的功耗,相当于管控或者是数据处理的机器来做各种各样的云产品。边缘因为本身机器数量少,对边缘资源的使用需要有更好的虚拟化的能力,更好的网络切片的能力。另外边缘要形成统一的“池化”,单个边缘支撑用户的时候,一般是满足不了客户,要把边缘形成统一的整体,通过调度和智能的预测来很好地做资源的弹性。
 
第三,边缘肯定不能独立存在,要跟中心做协同,也就是所谓的云边一体,不能简单地做一个中心管控,要做分布式的管控,中心对各个节点进行管理,每个子节点做自己的自治,自己有自己的一些配置或者是一些中台。在出现跨节点操作的时候,尤其是一些有状态服务的时候,也是需要做热迁移的,保证业务什么时候延展,对使用虚机使用存储的时候要让数据具备高可用性,以实现技术的迁移。

第四,边缘网络。边缘和中心比较大的区别是网络上的差异,中心是在高可靠的机房内,边缘是跨运营商、省、大区的,网络是基于公网做的不那么可靠的网络,在这上面需要做专网承载比较特殊的业务场景,确保任意一点到另外一点在系统成本上是可控的。
 
就以上提到的四个技术挑战,李克从两个角度做了展开,一个是资源的使用会接入云原生的使用,另外是网络方面,目前的云原生处在比较早期的阶段,以前资源是基于物理服务器,现在的资源交互形态变成容器了,以其交付云原生的好处有很好的弹性和很好的业务编排以及应用的注册发现等机制,可以让业务脱离繁重底层的IaaS层应用。
 
目前资源是基于容器交付使用,离真正的云原生还有一定的距离,云原生是标准化提供比较标准的服务能力。在云原生的使用方面,上层可以做好对应用的一些编排,像ESQIO管理自己的业务,弹性方面是比较容易理解,原来基于服务器在上架、部署、运维都是比较复杂的,现在云原生基于服务器做大量的资源,比如对于压侧系统在很短的时间内给中心压侧进行使用。
 
整个容器平台,最下面是边缘的节点,节点上有各种各样的边缘的kubelet能力,通过边缘网络和边缘的中间件打通形成统一的池化,下面是容器平台,也是有按区域或者是按一定的逻辑结点划分成不同的小的K8s的集群,上面做集群的管理,容器之上是云原生能力生态的建设,可以基于应用做一些应用管理的事情。
 
由于边缘网络是一张大网,承载了非常多的流量,需要做更好的规划,可以按照节点以一段距离以及流量规模分成最下面的接入网,也就是MEC节点的接入网,包括三四线城市的节点,包括上层核心网上的节点,每一层网络上的量级不一样。每一层需要提供的核心能力也有差异,最下面主要提供结构能力,确保客户就近接入实现低延时,在接入的时候有安全的能力,在ENS层做到很好的资源下沉能力,在地市级可以覆盖,在POP层做到大网的调控,可以做到加速和安全防控的能力,边缘云在终端和公有云做好端和边缘的协同以及边缘和中心的协同。
 
云边端整体的一张网需要较好地建立起来,基于边缘建立加速网,需要在节点和节点之间形成比较透明的传输,整个网络的链路是加密可靠的,整个加速效果也是确保在异常情况下可以快速且不断连接完成尽可能低成本的迁移。
 
在第三部分,李克介绍了阿里云目前的边缘云计算的产品形态。阿里云在边缘计算领域发力较早,首先是资源方面,之前的CDN和视频云做了很多年,具有一定市场规模,阿里云有大量的边缘节点存在,可以快速复用,另外中心云的云计算能力,无论虚拟化还是存储网络上都可以做一些下沉的小型化改造。
 
整个阿里云边缘云计算产品发展的脉络,刚开始是探索的阶段,2017年做基于边缘计算虚机计算的形式;2018-2019年覆盖到节点,目前有300多边缘计算的节点;再后来从IaaS层到PaaS层转化,希望可以承接业务场景,真正帮客户和行业解决具体问题,比较典型的类似城市大脑,智能电商,以及线下店的方案。

近期主要是在上层提供更多的PaaS服务的能力,提供应用的编排能力,在视频场景打造视频计算平台,能够把视频直播编解码的能力在边缘实现PaaS的服务,包括全球一张网的GRTN的网络,做到点对点快速的数据的传输,GRTN在双十一的时候对直播做了很大的优化,端到端五秒提升到一秒的延迟,效果还是比较明显的。
 
目前整个产品的能力在资源的形态上是三种不同的形态,虚机、容器、安全容器是对资源无感的,是对客户之间云中间件的能力调度使用聚焦到业务形态就可以了,在存储上也是多种存储能力,有本地盘也有对象存储、文件存储以及把CDN的KV缓存抽象出来提供对外更大规模的存储能力。
 
最后李克发表了对未来的展望,他说,边缘计算最关键有两个词:标准化和开放生态的建设。标准化很重要,如果想做融合云计算,各自建立一套是很麻烦的事,需要统一标准屏蔽掉厂商之间的差异,大家可以向一些生态看齐的,比如云原生建立起来,可以很灵活地使用各种云厂商的资源。开放方面也是比较重要的,大家的能力可以更丰富地体现,比如说内部沉淀了很多比较好的中心云能力,边缘上也要快速地建立起这些能力。

责任编辑:吴昊