腾讯云TCE「一朵云」的实践
作者 | 王德清
编辑 | 王亚峰
“云计算服务是一粒种子,我们都知道它将来会成为大树。”
正如亚马逊创始人贝索斯早年前所言,当消费互联网被定调为"流量红利开发殆尽",新一轮发展红利转向了传统行业,它们在数字化转型期间所产生的计算、数据存储等需求,为云计算带来机遇。
数据显示,95%的企业认为云计算可以降低企业的IT成本,越来越多的行业用户,如银行、地产、航空、零售业、制造业、农业,都存在上云诉求。
而除了企业自身需求之外,2020年伊始,新基建被写入政府工作报告,大数据中心、5G基建、人工智能和工业互联网俨然位列新基建七大领域,而在新基建的背后则需要云计算作为底座。
事实上,在国家相关政策及市场的驱动下,中国云计算行业延续了快速发展的态势。经过十余年的发展,云计算已经在关键技术和应用规模上实现了对传统IT的全面超越。越来越多的企业正加速上云。
然而对于传统以及部分行业企业而言,上云之路并非坦途,行业监管是企业云化过程中不可回避的话题。以金融行业为例,2011年12月28日,中国银监会就发布了《商业银行业务连续性监管指引》,明确要求商业银行的重要业务恢复时间目标不得大于4 小时,重要业务恢复点目标不得大于半小时。
因此对于传统企业而言,亟需一个专有云来承载其业务的云化进程,而如何解决这个难题,这是云服务商们不得不面对的难题。
1
如何为国内首家互联网银行筑基?
2014年,获得批复筹建的微众银行面临了一个难题。
作为国内首家民营银行和首家互联网银行,微众银行筹备之初就定位于普惠金融,其属性及定位决定了微众银行与传统银行有着本质上的区别,由于其大部分业务都是通过移动互联网场景向个人消费者和小微企业客户提供金融服务,这意味着微众业务系统构建除了要考虑安全合规等行业问题外,还要应对互联网场景下出现的高并发、快速迭代等新挑战。
不仅如此,由于微众银行定位于普惠金融,传统金融机构平均单账户50元左右的IT成本,也是微众银行想都不敢想的事情。
在这样严苛的要求下,微众银行将目光瞄向了腾讯云,希望将支撑过微信、QQ的云计算技术体系引入到IT架构中,以此获得云计算的弹性扩展、低成本以及海量数据处理能力。
对于腾讯云而言,服务互联网企业是其与生俱来的优势,但对于服务金融机构,这并非是腾讯所擅长的,同时也没有任何可以借鉴的案例。
面对可靠性、监管合规、运维要求以及建设周期等诸多挑战下,腾讯云原有的公有云模式需要从物理的基础架构层到业务应用层,整体进行深度适配的专有云改造。
其中,云数据中心物理建设按照银行标准重新设计,网络方案依照银行业务特点和隔离要求从软件隔离变更为物理隔离,还要确保从公有云中解耦出来的云平台适应新的网络方案。支撑体系也进行了剥离,以适应专有云环境下的场景需要。包括审计、安全等功能组件,以及此前一直成熟应用于腾讯支付体系中的自研核心数据库TDSQL,也根据场景需要进行了定制化开发。
值得一提是,TDSQL就此成为了第一个使用在银行核心系统的国产数据库。
就在微众银行开发人员与腾讯技术人员努力了半年之后,2015年8月,微众银行核心系统正式上线,TDSQL也承载了微众银行数百个核心系统和全行所有OLTP业务。
当前,微众银行每一个账户的科技运维成本降至仅为2.7元/年,仅为国内其它银行的1/10,相比国际银行则更低,只有其成本的2%至5%
截至目前,微众银行基于腾讯云搭建的分布式银行核心系统已成功服务超过2.7亿客户,实现单日金融交易峰值7.5亿笔,最高TPS达到10万+。
也就在这之后,一颗种子就此在腾讯云团队中埋下。
2
到底要不要做专有云?
事实上,即使有了微众银行的实践,但对于是否要做专有云这件事儿在腾讯云管理层中仍有犹豫。
犹豫的原因也很简单,第一是没有做过;第二个原因就是腾讯做能否给行业带来额外的价值。
“公有云是提供服务的,所有东西自己做,自己来控制,但是做专有云,很多事情就超出了我们的控制。这就好比开飞机,公有云就是我们自己造飞机自己开,但专有云不是我们专业的人员运营,是客户来开,怎么样让他很好地能去驾驶飞机,异常情况应该怎么处理,其实对整个产品的易用性、文档和服务体系有很高的要求。”腾讯云副总裁刘颖说。
据刘颖对雷锋网介绍,大体的难点主要有三个方面:
1、整个云软件的兼容性要很灵活,对不同规模的的客户,不同的机房和硬件环境,都要能够稳定健康的运行,因此要求腾讯云团队要做大量的适配工作;
2、软件的可运维性要达到很高的标准,需要能够被客户很好的运维,因为专有云的运维都由客户自己负责;
3、云的生态体系要足够开放,需要能够和合作伙伴的软件很好的融合,能够以一个有机的整体为用户提供服务。
而当腾讯集团将产业互联网作为一个重要的服务对象之后,对于是否要做共有就不再犹豫。
但腾讯云专有云中心总经理沙开波对雷锋网说到,刚开始做公有云也就只是将公有云上面的核心组件做一些裁减或者做一些定制化的开发,针对金融的客户去做私有化的解决方案。
由于微众银行的成功,腾讯云的相关技术逐渐应用到了其他金融客户业务之中,也逐渐的渗透到了其他行业用户之中。
逐步发展的过程之中,专有云团队却有小半年的时间走了一段弯路。
“我们当时拉了一个团队做专有云,这个做法最大的好处就是,短时间通过组织结构的变化,重视专有云,客户的需求有人响应。”但不久之后,问题却摆在了刘颖的面前。
如果按照传统私有云的做法继续做下去,一直为用户做定制化的产品,将会使得腾讯云专有云的产品竞争力不强。
此外,定制化工作也将会使得私有云团队越来越臃肿。
“太过于定制化,会使得私有云产品能力与腾讯云公有云能力距离越来越远,而客户是希望使用已经在公有云场景中经过验证且稳定的技术的。”沙开波如是说道。
随后,刘颖和专有云团队做了一个事情,就是将此前客户提出的需要定制化的需求,一条条过,看看是否可以放在公有云上统一迭代管理,而经过一段时间的验证,刘颖和专有云团队发现,这件事是行得通的。
也就在此,腾讯云做出了一个至关重要的决定:做一朵统一的云。
”这个决定让我们做了很多国外云厂商都不敢做的一件事情,就是我们一直要做通用的产品,标准化的产品,同时我们把API做好,这样生态就可以帮助你去做一些定制化的开发,甚至是用户自己也可以做一些他特有的定制化,这样就能够去打造一个生态协同可持续发展的道路,即能满足用户,腾讯云也能更好地聚焦自己的核心竞争力。”
这个决定之后,腾讯云专有云产品的开发也越发顺利,而专有云团队也从此前的金融行业部门转到基础产品部门。
3
“一朵云”的行业试炼
2018年1月,腾讯云正式面向全行业发布专有云TCE矩阵,矩阵中包含企业版、大数据版、敏捷版以及AI版。这是腾讯云在面向企业级客户私有云需求作的一次重大发布。
谁都不知道的是,这一次发布的背后,腾讯云做出了多大的努力。
据腾讯云专有云中心技术总监孙其琛介绍,腾讯云在与其他厂商共同竞争一个国有银行的云项目时,对方提出了要进行源代码审计,而面对这一要求,其余厂商要么就是没过关,亦或是听到了这个需求就望而却步了。
“代码审计第一是为了证明你敢拿得出手,第二要证明这个东西真的是你的。”孙其琛对雷锋网说到。
最终,这个国有银行选择了腾讯云的技术做为其底层支撑。
而对于此次合作,孙其琛表示,除了对方起初在“着装”提出了要求之外,在其他方面都磨合的很好,甚至在很多方面都还对腾讯的技术人员放宽了标准,比如可以允许腾讯的技术人员在休息室的沙发上躺着睡一觉,这是其他供应商都没有的待遇。
值得一提的是,如今腾讯TCE在其内部的部署规模也达到了一个其他竞品所无法企及的规模。
随之,腾讯云TCE也从单一的金融行业走向了更多行业之中,如贵阳政务云、上海徐汇区政务云、江门人才岛、广州地铁、央视频APP、工业富联、广汽、一汽大众、永辉超市、澳门电讯……
不断落地的过程中,腾讯云TCE不断的进行着升级,而现阶段升级的重点方向就是技术产品的全面云原生化。
“在这次重构之后,专有云在可交付、可运维、高可用、小型化方面的能力得到了全面的提升。经过产品能力迭代升级之后,专有云产品面向中小规模的腰部客户,包括其他行业的客户,产品竞争力也得到了很大提升。”沙开波如是说到
4
不断在“无人区”突破
在今天回顾TCE的发展,其每一步都走在了无人区,而这也就让腾讯云TCE的每一步走的异常踏实。
如今,腾讯云TCE的每一个能力都如同一块块乐高积木,不仅可以灵活组合,同时也可以随意裁减,而无论规模多大,其性能都不会受到影响。
同时由于秉持“一朵云”的理念,腾讯云TCE的能力也在不断增加,能够为客户提供更多可插拔的服务,也大大提高了客户的效率。
足够开放的特性,也让其能够完全适配市场上成熟应用的x86平台,还支持国产ARM生态。同时,在操作系统层面,麒麟操作系统、统信OS包括腾讯自研的TencentOS都具有较高的实用性、稳定性和安全可控性, 也有利于客户在信创过程中利旧。
这些特性也让腾讯云TCE成为了行业内“最能打”的专有云平台。
本文由雷锋网原创,作者:王德清。申请授权请回复“转载”,未经授权不得转载。
那些用推荐引擎改变世界的人
AI 人才越来越不值钱了吗?
联想闪离科创板的那些「骚操作」和「神联想」