专访丨阿里云 卢日:要将GRTN打造成为流媒体云原生aPaaS服务丨Distributed Cloud阿里云EdgePlus共 2585字,需浏览 6分钟 ·2021-09-29 21:34 9月16日,阿里云资深技术专家卢日接受了全球分布式云联盟专访,就GRTN网络的核心技术和竞争力等话题回答了记者提出的问题。GRTN是2019年云栖大会正式对外发布的,其中还包括了基于RTS的超低延时直播服务。GRTN的诞生,在阿里巴巴内部可以追溯到2018年,阿里云技术团队和手机淘宝技术团队共建的一套基于WebRTC的低延时直播协议。随着共建项目的推进,GRTN在业务上也取得了很多收益,越来越多的团队开始参与到项目中来。2020年初疫情爆发时,市场对RTC的需求急剧增长,团队借机将直播与RTC进行了融合,GRTN就此诞生。GRTN不是简单的对两套系统进行融合部署,而是以直播的CDN系统为底座,有机融合RTC网络基本特性,并通过架构有效解决了RTC网络面对上万台机器级联的问题。GRTN的核心竞争力GRTN的核心竞争力主要体现在三个方面。降低成本。GRTN本身是一个多业务融合网络,可以支撑直播、RTC、视频上云等多种业务场景,业务的复用率更高。同时,GRTN的内部链路更短,节点内成本更低。提升质量。GRTN内部网络提供动态选路以及层级网络混合组网,内部链路网络延时可以控制在20ms以内。内部链路网络采用的是私有协议进行高效的传输,客户端和推流的分发都是基于WebRTC构建的,QoS算法和参数择优都专门针对流媒体的特性来设计,并基于线上数据持续打磨迭代。便于扩展。GRTN支持WebRTC协议,可以在单个连接通道上,从而可以很自由的进行分发和订阅,在业务的扩展性上带来了更大的想象空间。GRTN的关键技术对等组网和路径动态规划传统的直播架构是一种层级的树状结构,由于媒体流的链路相对比较固定,这种结构的在产品初期可以把研发资源更多的投入在媒体协议的处理上,对于快速构建产品能力是相对风险可控的。但随着业务的发展,这种架构的缺陷也会越发明显,比如延时高、成本高,而且扩展性也比较差等,在一定程度上是阻碍业务发展的,比如延时很难突破到6s以下,视频的互动只能借助旁路连麦系统等。为了根本上解决这一系列问题,并结合层级结构有助于系统运维和容量评估,而网状结构有益于构建高质量和低成本的网络的特性,GRTN采用了混合组网方式,即层级结构和对等图形方式相结合的组网的方式。选路中心会周期性收集内部链路探测的结果,为了配合动态组网,流媒体大脑模块需要对流信息进行管理,同时还需要支持路径切换、容量规划以及在成本和质量之间做综合的调度。多路径传输为了能够提高GRTN内部链路传输的可靠性,以及考虑在成本和质量间的均衡,GRTN支持如下3种内部链路多路径传输模式:竞速模式、备选模式和智能模式,可以在高可靠,质量,成本等诸多因素控制下进行适配和自适应的切换。双向实时信令网前面提到GRTN核心价值之一是高质量,高质量除了延时低以外,还需要考虑快速容灾切换能力,以及提升首屏秒开率等核心指标。在RTC场景下有一个比较常用的功能是客户端网络的Mobility,比如用户在开会的过程中回家或是离开家的时候手机网络需要在4G和wifi之间切换,另外考虑客户端接入的CDN节点出现异常的时候。这两种情况都会造成客户端在和GRTN通信过程中切换接入节点,GRTN构建的双向的实时信令网能够做到切网消息的毫秒级传递,当有一个发布端的媒体流发生网络切换后,订阅的客户端对GRTN内部发生的切换行为是完全无感知的。基于A/B测试持续迭代的QoSGRTN之所以能够做到在直播延时由6s降低到1s以内,RTC通信延时做到250ms左右,除了图形网的结构的改造以及协议下沉等技术外,最核心的还是有采用了有媒体特性感知的QoS,这和TCP或QUIC这类通用QoS策略在本质上是不一样。WebRTC的QoS是一个针对流媒体特性的多维决策体系,涉及到的算法和策略参数非常多,为了方便业务层对底层QoS算法和参数的择优,GRTN设计了一套可插拔的的QoS集成框架,结合GRTN数据化的质量评估体系,可以做到一次集成持续迭代,不同的算法和参数都可以利用GRTN的A/B质量评估体系进行线上评估,形成赛马机制。同时QoS和文章前面提到的动态路径规划也是有很多结合点的,QoS研究中的一个很重要课题就是需要区分出网络的抖动和拥塞,如果是拥塞那就需要反馈给上游进行信源带宽调配(比如降码率,流切换等)。但如果只是短暂的抖动,就可以启用相对激进的抗丢包策略,动态路径规划也面临类似的问题,如果是只是短暂的拥塞,可以保持当前链路并借助QoS的抗丢包策略来扛,但如果是链路拥塞了,则需要尽快切换链路。可编程流媒体技术的上层业务场景非常丰富,比如电商直播、视频会议、在线教育、企业直播、新零售等,因此有很多定制化开发的需求。可编程化改造是GRTN在提升系统稳定性上的一次尝试,目前GRTN的中心流媒体大脑,节点侧的业务模块,媒体数据发送模块、媒体信令处理模块等都已经进行了可编程化改造,大部分情况下都可以避免二进制的发布。GRTN生态发展GRTN经过阿里多个团队协作研发和打磨,目前阿里内部多个APP和网站都已经上线了超低延时的直播能力,包括淘宝、钉钉、Lazada、优酷等。在去年淘宝双十一直播中,基于GRTN的电商直播延时降低了80%以上,流畅度提升30%以上。今年双十一,团队将继续在压缩延时、提高流畅度和清晰度方面着力。在对外商业化方面,GRTN的RTS所服务的域名数以达到数千个,帮助客户提升了直播体验,比如某直播平台在上线RTS后,直播时延降低了70%以上,视频渲染卡顿降低40%多。GRTN在经历了双十一、疫情冲击等场景和市场的考验后,在质量和成本等诸多方面积累了大量的经验,阿里云对这些经验进行了抽象的总结,希望GRTN能够为企业的流媒体应用构建提供更加专业的服务。阿里云提出,要将GRTN打造成为流媒体云原生的aPaaS服务,GRTN不仅基于云原生,更是面向云原生设计的,致力于提供流媒体云原生服务,方便客户灵活构建流媒体应用,让流媒体服务无处不在。往期推荐 浏览 51点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 电子书丨《云原生模式》博文视点Broadview0电子书丨《云原生操作系统Kubernetes》博文视点Broadview0阿里云-云原生大数据计算服务 MaxCompute数以万计的企业正基于 MaxCompute 进行数据计算与分析,将数据高效转换为业务洞察。阿里云0阿里云基础上云服务提供阿里云账号服务和基础云产品部署服务的咨询和指导。青莲网络0阿里云-云原生数据库 PolarDB MySQLPolarDB 100%兼容 MySQL,交易和分析性能最高分别是开源数据库的6倍和400倍,TCO 低于自建数据库50%阿里云0阿里云-容器服务提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理阿里云0云原生安全风险“避坑”指南丨IDCFDevOps0专访时速云|容器云“老兵”与云原生“新战场”中智观察0阿里云-边缘容器服务是一款提供标准 Kubernetes 集群云端托管,支持边缘计算资源、业务快速接入、统一管理、统一运维的云原生应用平台阿里云0阿里云要打造万亿产业链电商行业0点赞 评论 收藏 分享 手机扫一扫分享分享 举报