阿里云刘易承:边缘容器云应用管理的思考与实践
5月10日下午,分布式云网在线研讨会边缘计算专场——边缘计算的“术”与“业”在多家平台与网友见面。边缘计算领域大咖们就边缘计算这一热门技术话题,结合自身的技术和商业实践,分享了大量宝贵的技术创新和实践案例,同时也以自身的术业专攻为广大网友答疑解惑。
阿里云边缘容器云应用托管平台负责人刘易承分享了《边缘容器云应用管理的思考与实践》。
一
边缘云的形态和价值
边缘云是由大规模地域分散的边缘节点构成,节点间协同合作、远程统一管控;边缘云具备低时延、高带宽、安全可信、就近接入等特点;基于统一调度能力构成全网一朵的标准分布式云。
边缘云对于客户的价值也是显而易见的,由于距离客户终端距离近,低延时和就近接入,能够有效释放终端设备压力,一些原本在中心运行的业务可以下沉到边缘云,使得终端的性能得以更好的解放;经由边缘云形成的大规模广覆盖分布式算力,能够像水电基础设施一样随用随取;阿里云边缘云还提供按量付费、弹性扩容和云原生交付方式,用户综合成本相对较低,运维管控的投入成本也比较少。
目前,阿里云在全球构建了2800+个边缘云节点,全网带宽输出能力150+Tbps。
二
边缘云容器平台技术架构
在边缘云基础设施方面,阿里云拥有大量的多云融合资源,在资源建设的基础上,阿里云构建了异构资源的云化纳管能力,向下管控和接入不同类型的资源,向上输出统一的运行环境为上层服务所用。
边缘云平台服务层分为两块,首先是K8S多集群管理的核心能力,阿里云应用大量的K8S集群,配合边缘工作负载、镜像服务和服务网格,输出K8S定制能力;旁路系统上,阿里云边缘云容器平台技术架构具有联合调度、云间协同通道、可观测性、可运维性等系统,上述系统之间相互结合,构成了一个稳定的分布式且具有边缘特性的容器服务。另一块是边缘应用管理,向下对接边缘容器服务,向上提供抽象的边缘应用接口,为客户提供更高层次的应用管理能力,包括特有的应用编排、差异化配置管理、弹性扩容等能力。
最上层是边缘能力开放层,提供OpenAPI、工具链、能力开放平台等,作为阿里云向客户释出能力的接口,客户通过开放层可以使用阿里云边缘容器平台的各项能力。
三
边缘云容器应用管理核心技术
1 多层管控结构
管理单元:边缘应用的最大特性就是地域分散、规模庞大,单元化管理是必备能力。通过设计资源单元和应用逻辑单元,提供双层的单元化划分模型,允许客户以任意自定义标准管理应用和实例,给予极大的灵活性。
配置差异化:多层管控结构支持OAM应用管理模型,提供配置模板动态渲染能力,为应用执行差异化配置渲染,适配对应单元的自有特性,一次发布全网智能部署。
配管分离:多层管控结构还支持应用工作负载及其配置文件独立管理和配置,也支持helm chart模式打包上传配置。
粒度发布:按照管理单元粒度执行发布,可精确到容器实例级别控制发布节奏,基于多层管控结构,可以按照单元级别进行发布,也可以按容器实例级别发布。
2 大规模发布管理
任务管理:边缘场景下应用实例规模大、分布广,传统单一的滚动发布模式不再适合,采用多组发布任务的模式分批进行发布,并通过单一管控面进行任务的管理,为用户展示所有的发布状态,支持分批次分节奏按不同范围进行发布,满足了用户的相关需求,并保障了发布的稳定性。
多策略支持:配合自研k8s工作负载,支持蓝绿比例发布、某个单元节点内的滚动升级、指定Node组升级以及单实例独立升级等多种发布策略,满足不同类的客户需求。
事件总线:边缘大规模实例场景下k8s事件处理较为复杂,通过自研事件总线中间件将多集群k8s事件统一处理,按需输出到各发布执行组件,减少状态同步复杂性。
3 边缘工作负载
为了适配边缘场景,阿里云边缘容器提供大量自研k8s功能负载。
FlexibleSet
FlexibleSet原生支持k8s多集群,允许用户选定Node自动匹配目标集群并部署Pod实例,且支持配置修改和动态部署,在工作负载运行的同时支持任务动态拉起或关闭服务。
FlexibleSet具备深度集成边缘融合调度能力,支持多种方式圈定下层资源范围,例如通过提交资源需求方式,通过动态调度能力,基于库存或水位情况,分配资源,并拉起对应的实例。
此外,FlexibleSet的使用方式与原生DaemonSet一致,使用成本低。
GridDeployment
GridDeployment支持每个Node部署多个副本实例,所有Node副本数一起同步变动;支持精确到Node级别的版本发布更新;边缘自治方面,基于k8s提供边缘自治能力,Node离线后Pod仍可以正常运行。
FlexApp
为了更好的体现灵活性,阿里云边缘容器团队自研了FlexApp,支持每个Node的副本数独立设置、独立扩缩容,对异构机器环境更友好;支持单个Pod的版本独立升级,提供更强的版本控制灵活性;FlexApp的更新发布能够精确到单个Pod级别。
四
实践案例
1 CDN流量型计算产品实践案例
流量型计算产品是阿里云边缘容器云的一个典型落地案例,对CDN产品加入了可编程的能力,从而允许客户在全网流量分发的基础上使用全网算力资源,在就近位置接入计算服务,最大化发挥流量的业务价值。
增强流量价值:在传统流量分发业务上增加算力分发能力,增强业务流量价值;
边缘计算典型场景:基于阿里云海量边缘算力,在任意位置随用随取,减轻终端压力;
大数据及AI:在大流量大数据场景下提供了可编程能力,为大数据及AI计算提供基础。
2 云游戏产品实践案例
云游戏概念近几年异军突起,阿里云边缘云游戏产品则将概念转换为产品进行了落地实践,基于边缘容器云技术底座,为客户交付高质量且稳定的云游戏实例
统一管控:从下层的ARM阵列服务器到上层容器应用均通过容器云平台进行管控,全流程服务保障,确保云游戏实例高效率生产;
标准化交付:基于边缘容器应用管理能力,通过容器化方式打包所有云游戏实例运行时以及配置依赖,以标准容器应用方式交付,提高交付效率;
降本提效:通过容器应用实例编排能力,单一板卡运行多个安卓容器,提升效率降低资源成本。