302022.12

数据库行业研究:信创的关键环节

2022.12.30

1、行业概览:IT核心基础软件,行业景气向上


  数据库:IT行业的核心基础软件

  数据库是IT行业的核心基础软件之一,是组织、存储、管理、分析数据的系统,在信息系统的软件和硬件之间起到承上启下的作用。 数据库(Database, DB) 由数据库和数据库管理系统组成,主要指按照一定的数据结构来组织、存储和管理数据的仓库,是一个长期存储在计 算机内的、有组织的、可共享的、统一管理的大量数据的集合,能够接受外部请求,对数据进行存取操作,并持久化存储的系统。 数据库管理系统(Database Management System, DBMS)是对数据库进行统一管理和控制的大型软件,主要由内核组件集和驱动组件构成, 其中内核组件集按照功能模块划分为管理组件、存储组件、计算组件和网络组件。

  数据库:历经商业数据库、开源数据库、云数据库三个时代

  从商业到开源和云数据库时代,数据库发展的三个阶段,成就了三种商业形态。根据墨天轮报告, 商业数据库时代:以Oracle、DB2等为代表,成就了商业软件行业; 开源数据库时代:以MySQL、PostgreSQL为代表,成就了开源开放的互联网时代; 云数据库时代:是商业和开源的融合时代,以新的供应和使用模式,成就了云和数字化企业。

  数据库市场的核心驱动力:数字经济、数据量、数据结构、部署环境

  数字经济的发展,数据量的高增、数据结构和来源多元化、 以及部署环境的日益复杂等是数据库产业的核心驱动力。 IDC预计,2018-2025年,中国数据量复合增速达30%, 2025年将达到48.6ZB,成为全球第一。届时,全球数据 量将达到175ZB。

  预计2021-2025年中国数据库市场规模CAGR为29%,公有云模式为主

  根据IDC数据,(1)全球:2021年,全球数据库管理软件市场规模为646.2亿美元,预计2025年将达到1068.8亿美元, 2021-2025年CAGR为13%,其中,公有云模式的数据库占比将从2021年的44%提升至2025年的64%。(2)中国: 2021年,中国数据库管理软件市场规模为42.3亿美元,预计2025年将达到117.2亿美元,2021-2025年CAGR为29%, 其中,公有云模式的数据库占比将从2021年的64%提升至2025年的74%。

  数据库未来趋势:新型硬件、多模、云原生、分布式、智能化

  数据库技术近年来得到了迅速发展,新型硬件、新型交叉学科技术、新型数据模型、安全隐私等因素对数据库技术的发展 起到了至关重要的作用,产生了很多的新型数据处理技术,主要包括基于新型硬件的数据管理、智能数据管理、多模数据 管理、数据安全和隐私保护。

  

2、结构分析:关系型为主,云、分布式前景好


  数据库行业分类:产品多样化发展

  数据库可以按数据模型、业务负载特征、架构模型、部署模型多种方式进行划分。

  数据库行业分类:关系型数据库占比超过60%

  IDC将数据库管理系统软件分为关系型数据库、NoSQL数据库、低代码数据库、导航式(层状)数据库、数据湖管理系 统、内存/缓存数据库六大类。 关系型数据库占据主要市场。根据IDC数据,2021年全球数据库管理软件中,关系型数据库占比69.9%,中国市场中, 关系型数据库占比64.2%。不同于全球市场情况,中国市场数据湖管理系统占比较高,达21.8%。

  关系型数据库:通常为“表格”结构,可分为OLTP\OLAP\HTAP

  关系型数据库的基础是关系数据模型,由关系数据集、完整性约束规则和关系运算三部分构成。 通常情况下,关系数据集用多个表格作为 数据结构来表示。用户可以定义表之间的关联。表中的列可以进行连接、并、交、差等关系代数运算。 按业务负载特征进行分类,关系型数据库可分为交易型数据库(OLTP)、分析型数据库(OLAP)和混合负载数据库(HTAP)。交易型数据库满足 处理在线 的实时交易事务场景,而分析型数据库满足分析业务场景,混合负载数据库目标是同时处理简单交易和复杂分析场景。

  关系型数据库架构分类:本地部署和云原生

  当前部署形态主要分为两种,分别是本地部署和云原生数据库。按照架构分类主要有三类:单机、集群、分布式。其中云 原生数据库和分布式数据库受到广泛关注,也成为国内数据库厂商重点突破口和主要发力方向。

  IDC:2021年,全球和中国数据库市场中,云厂商市占率领先

  根据IDC数据,(1)全球:2021年,全球数据库管理软件市场中,Microsoft、Oracle、AWS市占率排名前三,份额分 别为32.5%、22.7%、11.5%。(2)中国:2021年,中国数据库管理软件市场中,阿里巴巴、华为、腾讯市占率排名前 三,份额分别为28.3%、10.8%、9.9%。

  Gartner:2021年云部署数据库占比49%,云厂商市占率领先

  根据Gartner数据,2021年,全球数据库市场收入近800亿美元(5201亿元人民币),同比增长22.3%。 云成为数据库的新动能。2021年,托管云服务 (dbPaaS)的收入增至392亿美元,现在占DBMS收入总额的49%以上。 市场份额显著增长的厂商,都是因为云的优势而获得市场成功。

  关系型数据库:预计2022-2026年CAGR为28.1%

  根据IDC数据,2021H2,中国关系型数据库软件市场规模为15.8亿美元,同比增长34.9%。 其中,公有云关系型数据库规模8.7亿美元, 同比增长48.7%;本地部署关系型数据库规模7.1亿美元,同比增长21.1%。预计到2026,中国关系型数据库软件市场规模将达到95.5亿 美元,未来5年CAGR为28.1%。 在本地部署模式市场中,由于利好政策的驱动,本土厂商市场份额都得到迅速扩大。如:在政府行业,达梦数据库、人大金仓在过去一年 中获得了大量的订单;华为在政企、金融行业也获得了突破。总体上看,本土厂商的份额正在快速追赶上Oracle、IBM等国际厂商。 公有云关系型数据库市场集中度更高,前五名厂商占据接近90%的市场份额,或主要系公有云数据库与云产品捆绑销售等原因。

  分布式数据库:以解决数据容量扩展为首要目标

  目前,分布式数据库的技术路线选择都是以解决数据容量扩展问题为首要目标,主要方案又分为分库分表+中间件、原生分布式等。 (1)分库分表+中间件,方案其实是由下层的单机数据库提供存储和执行能力,在多个单机数据库上封装了一层中间层来补充分布式能力,统一数据分片规则,管理 分布在不同数据库节点的数据,并提供SQL解析来请求转发和结果合并。 (2)共享存储分布式数据库,方案是计算节点独立并且共享一个不带计算功能的存储集群,也叫shared-storage。数据存储的底层是可动态扩展的分布式高性能存储, 存算分离架构,计算层和存储层都可以实现动态扩缩容。 (3)去中心化的分布式数据库,方案是每个节点都有独立的计算和存储功能,并且节点之间不共享数据。为了平滑的扩缩容采用了存算分离的架构,分布式集群的每 个节点都是独立的节点,通过这个multi-paxos或者multi-raft等共识算法来保证多副本的可用性。

  NoSQL数据库:易拓展、高可用、大数据量高性能、数据模型灵活

  NoSQL,是对不同于传统的关系型数据库的数据库管理系统的统称。NoSQL数据库的产生就是为了解决大规模数据集合和多重数据种类 带来的挑战,特别是大数据应用难题。因为NoSQL数据库去掉了关系数据模型的特性,因此数据之间没有关系,容易进行扩展。此外,得 益于NoSQL 数据库数据模型的无关系性,数据库的结构变得比较简单,因此更容易支持海量数据的存储和高并发读写,性能比较优秀。

  

3、国产替代:信创加速渗透,关键行业空间广


  受益于市场需求和技术沉淀,国产数据库进入百花齐放的快速发展期

  国产数据库历史:(1)20世纪80年代我国数据库市场开始起步。(2)21世纪初,基于 863计划、核高基计划等国家政策支持,一批拥 有高校背景的国产厂商成立,打破了Oracle和IBM一统天下的格局。(3)2010s, 随着市场需求的增长、技术的沉淀,一批云厂商和新 兴独立厂商开始提供数据库产品。(4)近年来,借助国产化热潮,许多软件厂商、集成商、运营商等也开始入局,发展自己的数据库能力。

  国产数据库:政策驱动力强

  在信创风口下,国产数据库迎来发展新机遇。2020年8月,国务院印发《新时期促进集成电路产业和软件产业高质量发展的若干政策》, 同年,重点领域的信创集采加速启动,促进国产软硬件企业加速迭代。经过多年的市场投入和政策支持,我国信创核心产品已从“可用” 走向“好用”,产业生态持续完善,产业发展即将步入成长期。

  国产数据库迎来信创加速的重大发展机遇

  信创产品进入好用阶段,并从党政、金融、电信逐渐向全行业渗透,且重点行业的国产化基础软硬件采购比例有望持续提 升。2022年5月26日消息,深圳出台《深圳市关于促进消费持续恢复的若干措施》,将信创与促消费政策并列,并明确具 体国产化率指标。我们预计,未来,深圳针对重点行业及党政机关、国资国企的量化采购指标将步入常态化,或为全国其 他地方政府提供示范引领。

  关键行业中,关系型数据库仍具备非常高的国产替代空间

  根据IDC数据,2021H2,中国关系型数据库市场-本地部署模式中,Oracle仍然占据第一大份额,为19.3%,Oracle、 Microsoft、SAP、IBM合计市占率为43.9%,在增量市场中,国外厂商仍然占比较高的市场份额。 政府、金融、运营商等国家关键行业中,由于支撑大量的涉账业务,业务正确性和连续性关系国计民生,在强监管压力 下,对数据一致性要求极高,所以主要应用以关系型数据库为主。据中国信通院统计分析,以业务系统数量为计数单位, 我国金融行业各类数据库占比为 Oracle 55%、DB2 19%、MySQL 13%、PostgreSQL 6%,其他 7%。