国产数据库:机遇和挑战深度分析
全球数据库行业的 4 个趋势:
1)关系型数据库仍然占据主导地位,非关系型数据库逐渐崛起;
2)云厂商自研数据库逐渐崛起;
3)开源数据库的重要性逐渐提升;
4)为适应复杂的应用场景,多模数据库成为重要方向。
国内数据库厂商受益于三个机遇:
1)信创战略对国产生态体系的推动;
2)大数据时代,非结构化数据处理需求以及高并行运算带来数据库行业技术革新,国产厂商存在弯道加速的机会(不一定短期内可以超车);
3)国内云计算巨头入局,一定程度改变了竞争边界,打破了过去以 Oracle 为代表的巨头垄断格局。
数据库是非常重要的基础软件,和操作系统、中间件并列为三大基础软件。几乎所有的应用软件都要基于数据库去存储、管理和处理数据,数据库直接影响到应用软件的运行效率、可拓展性、灵活度和可靠性。对于应用软件的开发,选择合适的数据库是非常重要的环节。
数据库随着数据处理的需求不断变化:早期是一致性的数据,随着互联网、云计算、AI 的发展,非结构数据重要性开始提升,数据库也经历了由集中式向分布式的演化。另外,互联网对于低成本数据库的需求,催生了开源数据库的兴起。主流的云服务厂商,很多都有自己研发的数据库产品,也成为行业内的一股新兴势力。
数据库根据数据结构和功能这两个维度进行划分。根据数据结构,可分为:关系型数据库、非关系型数据库;根据功能不同,可以分为:操作型数据库、分析型数据库。
不同类型的数据库侧重点不同,相应的优势和适用领域不同,也存在各自的短板。所以,并不存在可以适合所有领域的数据库产品。
操作/交易型数据库:主要面向两类事务数据:需要记录下来的数据,以及临时数据。需要记录的数据一般和应用软件相关(比如 ERP,CRM 等),需要稳定存储下来,以便在未来某个时间进行查询或分析使用。临时数据一般也和应用软件相关,但是诞生于软件运行过程中,而且在应用软件任务结束后,没有必要存储下来的数据。因此,临时数据对于一致性的要求更低,经常使用非关系型数据库进行处理。
分析型数据库:并不直接链接到某个应用。常用于数据仓库、商用智能软件和数据科学场景。分析型数据库经常包含了从操作性型数据库提取出来的,用于大数据分析的数据。
关系型数据库是建立在关系模型基础上的数据库,关系模型就是“一对一、一对多、多对多”等关系模型,一个关系型数据库就是由二维表及其之间的联系组成的一个数据组织。关系数据库基于结构化的查询语句(structured query language, 简写为 SQL)。关系型数据库包括主流的 Oracle,Microsoft SQL Server,MySQL,PostgreSQL,DB2,Microsoft Access, SQLite,Teradata,MariaDB,SAP 等。
关系型数据库目前仍占据主导地位。据 DB-Engines Ranking 统计,全球受欢迎度前十的数据库名单中,有 8 家是关系型数据库,Oracle、MySQL 和 Microsoft SQL Server 占据前三。
关系型数据库最大的特点是数据的一致性(事务一致性),由于以标准化为前提,数据更新的开销很小。而传统的关系数据库的横向拓展性不强,灵活性不足(由于预先定义了关系结构)。传统的关系型数据库,在涉及到大量的非结构化数据以及高并发操作的领域表现不佳。
非关系型数据库:为了处理非结构化数据,同时适应高并发、灵活拓展的需求,非关系型数据库应运而生。非关系型数据库也支持除了 SQL 之外的语句,因此也被标记为 NoSQL。根据数据存储形式不同,非关系型数据库包括:文档型、图像型、健-值存储型、时间序列型和宽列式数据库。
非关系型数据库的优势在于易用性、灵活可横向拓展,对于非结构化数据处理能力更强。而且,非关系型数据库经常内置于 API 之内,开发者无需深入理解数据库的结构就可以简便地实现查询。非关系型型数据库主要的短板在于数据不一致性,而且技术发展也不如关系型数据库成熟。
全球数据库的市场份额(商业版)仍然存在少数寡头垄断局面。从市场份额来看,根据 IDC 数据,Oracle、微软、IBM 占据了关系型数据库收入份额的 79%,垄断地位较高。非关系型数据库中,微软、IBM 和 InterSystems 的收入份额占全球前三,总计为 76%。整体来看,商业版本市场中,少数寡头的市场地位仍然较高。
国内的数据库理论最早在 1970 年代引入,在部分领域进行了自研,但在发展早期,市场仍然由Oracle、IBM、DB2、Informix 主导。随着互联网兴起,MySQL 等开源数据库被互联网厂商青睐,互联网行业的飞速发展也带动了国内对于数据库技术和知识的重视程度,人才资源逐渐积累。在 90年代末和 21 世纪初,重要的国产数据库公司成立,并开始进入市场。随着云计算的发展,云厂商针对云的业务场景自研的数据库也登上了历史舞台。整体来看,Oracle、IBM 等海外厂商在国内的市场地位不断削弱,属于国产数据库的行业空间逐步展开。
国产数据库行业“老四家”+新巨头格局:老四家是达梦、人大金仓、南大通用、神舟通用;新巨头是阿里 Oceanbase、华为高斯 GaussDB、。国产数据库发展面临的主要压力是,以 Oracle 为代表的国际巨头厂商的技术壁垒、生态基础和先发优势较强。数字时代新的需求导致的数据库技术革新,为国产数据库发展提供了机遇。在大数据时代,高并发运算、非结构数据处理、灵活拓展等需求的重要性提升,使得传统的关系型数据库巨头厂商过去针对集中式数据场景的技术优势被削弱。国内互联网行业蓬勃发展,互联网巨头入局,也带来了行业竞争边界的变化。整体来看,随着信创战略的推广,国产数据库产业有望获得新的发展机遇。
武汉达梦成立于 2000 年,为中国电子信息产业集团(CEC)旗下基础软件企业。达梦专业从事数据库管理系统的研发、销售与服务,同时可为用户提供大数据平台架构咨询、数据技术方案规划、产品部署与实施等服务。
不仅限于传统的关系型数据库,达梦的产品分为数据库产品、大数据平台和开放云平台三类。
目前,达梦的数据库系列产品已经可以在功能上对标 Oracle 数据库系列。
人大金仓由中国人民大学一批最早在国内开展数据库教学、科研、开发的专家于 1999 年发起创立,人大金仓在电子政务、党务、国防军工、金融、智慧城市、企业信息化等方面拥有强大的数据产品及解决方案研发能力、资源整合能力和项目实施服务能力。
人大金仓产品技术体系:经过近 20 年的发展,人大金仓构建了覆盖数据管理全生命周期、全技术栈的产品、服务和解决方案体系,产品广泛应用于电子政务、国防军工、电力、金融等行业。
南大通用:成立以来一路辉煌,获得 Informix 技术授权。天津南大通用数据技术股份有限公司成立于 2004 年,以“让世界用上中国的数据库”为使命,打造了 GBase 8a/8t/8m/8s/8d/UP/InfiniData 一体机等多款自主可控数据库、大数据产品。2018 年,南大通用 GBASE 品牌已成功进入 Gartner 分析型数据管理解决方案的魔力象限。
公司代表产品:GBase 8a 分析型数据库,主要市场是商业分析和商业智能市场。产品主要应用在政府、党委、安全部门、国防、统计、审计、银监、证监等领域,以及电信、金融、电力等拥有海量业务数据的行业。
平台型产品:南大通用统一数据平台 GBase UP,融合 GBase 8t、GBase 8a MPP 和 Hadoop 生态的大数据平台产品兼顾大规模分布式并行数据库集群系统、稳定高效的事务数据库,能够适应OLAP、OLTP 和 NOSQL 三种计算模型的业务场景。
神舟通用:航天科技集团旗下的国产数据库厂商。天津神舟通用(简称:神舟通用)隶属中国航天科技集团公司,是国内最具影响力的基础软件企业之一,获得国家核高基科技重大专项重点支持。
产品主要包括神通关系型通用数据库、神通 KStore 海量数据管理系统、神通 xCluster 集群件、神通商业智能套件等。基于产品组合,可形成支持交易处理、MPP 数据库集群、数据分析与处理等解决方案。公司客户主要覆盖政府、电信、能源、交通、网安、国防和军工等领域,率先实现国产数据库在电信行业的大规模商用。
总结:国产数据库领域,大数据和人工智能的发展,使高并发、灵活拓展、非结构化数据处理的需求逐渐提升。云计算厂商自研数据库版本崛起、开源势力逐渐壮大,在一些领域也冲击了传统关系型数据库巨头的垄断地位,为国产数据库版本的发力提供了空间和机遇。
完整内容参考《国产基础软硬件:开源、迁移、上云,关键在生态》内容如下,下载链接:国产基础软硬件:开源、迁移、上云,关键在生态
相关下载:CPU和GPU研究框架合集
1、行业深度报告:GPU研究框架
2、信创产业研究框架
3、ARM行业研究框架
4、CPU研究框架
5、国产CPU研究框架
6、行业深度报告:GPU研究框架
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。