082022.07

重磅丨赛迪数据库市场研究报告,最大黑马竟是它?

2022.07.08

“在数据库领域,万里数据库已经默默耕耘了16年,如今,万里数据库已经悄然走向了前台,开始崭露头角。”


近日,赛迪顾问发布了《“十四五”关键应用领域之数据库市场研究报告》。赛迪直属工业和信息化部中国电子信息产业发展研究院,所以,能拿到一些媒体拿不到的官方数据,比如:关键应用领域数据库部署情况等,因此,有一定参考价值。

重磅丨赛迪数据库市场研究报告,最大黑马竟是它?


值得关注的是,此次报告中,万里数据库进入领导者象限,成为最大黑马。


按赛迪报告对领导者象限厂商的定位:企业产品技术路线符合市场需求、市场占有率较高,且技术具有领先性,在某些方向具有一定的领导力。而且公司产品安全性高,符合关键应用领域需求。


万里数据库入围领导者象限是否实至名归?


说实话,阅读报告前,我其实有些不以为然。但仔细阅读报告后,我意识到之前的判断可能有些草率和片面了。

万里数据库的异军突起,还是有一定数据与事实支撑的。当然,这是建立在特定市场与特定条件的基础之上。

赛迪报告评价模型采用竞争力四象限图模型,从技术先进性产品安全性两个维度对企业展开评估。

从象限图中可以看到,万里数据库处于领导者象限的中间位置,在产品安全性和技术先进性方面,与国内熟知的一些数据库厂商位于同一领先水平。

报告开篇就强调:

“本报告主要研究在关键应用领域中应用的数据库产品,涉及的数据库均为商业发行版。”

这句话,我理解有两层意思:

其一,调研对象仅针对数据库商业发行版,排除了开源版(社区版)产品,这或许就是为什么有些数据库厂商并未出现在这份报告中的原因;

其二,报告针对的并非全市场,而是关键应用领域市场。


那么,什么是关键应用领域?

报告给出的定义是:

关键应用领域是指面向公众提供网络信息服务或支撑能源、通信、金融、 交通、公共事业等重要行业运行的信息系统或工业控制系统。毫无疑问,关键应用领域其实就是国产化替代首当其冲的产业。


为什么评估模型要基于技术先进性和产品安全性这两个维度?


这两个维度又具体包含哪些因素?该报告也给出了原因。这与在“十四五”关键应用领域建设过程中,对数据库的要求直接相关:


一、对数据库安全性要求更高

关键应用领域被视为重要的信息基础设施与行业,因为它们的中断或破坏将对重要的社会功能产生严重影响。这些系统一旦故障,会影响重要行业的正常运行,对国家政治、经济、科技、社会、文化、国防、环境以及人民生命财产造成严重损失。


据报告介绍,安全性这项指标主要考虑:公司股权结构、产品安全等级、客户类型等因素。

二、对数据库技术架构先进性要求更高

为什么关键应用领域对数据库技术架构先进性要求更高?报告指出,这取决于现阶段,数据库产品面临两大技术挑战:


1、支撑云计算时代新的技术要求

依托公有云的存储和计算资源,云数据库实现了存储和计算的完全解耦,在提供近乎无限的延展性和高弹性的同时,亦保障了数据的一致性,并支持结构化和半结构化数据的处理。同时,云数据库平台作为服务整体交付,节约了用户管理基础架构所需的成本、时间和资源。目前,数据库管理软件向云端的迁移亦成为明确趋势。


2、满足数据量剧增背景下,如何高效稳定地使用数据,支撑业务发展

随着计算载体的迭代与业务需求的相互促进,传统数据库在某些伸缩性强的业务场景中已难以满足市场需求,分布式数据库在这些场景中的优势便显现出来。在数据量剧增的背景下,集中式数据库显现出了存储建设成本高、扩展性较差等问题。

分布式数据库则通过资源池化管理,实现物理或逻辑层的相互隔离和资源的自由伸缩,具备弹性扩张、HTAP事务、多租户管理、高可用等能力,与云计算场景需求相匹配。

同时,分布式数据库对多种数据类型的兼容,可以实现对存储于不同物理服务器、不同格式的数据进行结构与算法的优化,突破服务器类型的限制,为上层不同类型的应用提供多模式的数据服务。

因此,基于以上两大挑战,云数据库及分布式架构成为现阶段最热门的技术路线。数据库产品是否考虑到新的技术要求并与新兴技术融合,就成为了一项重要指标。

当然,技术先进性这项指标也并不仅限于此。据该报告介绍,这项指标主要考虑:产品架构、技术路线、服务体系、应用案例等因素。

搞明白了产品安全性及技术先进性两个维度所包含的具体指标,万里数据库凭什么能进入领导者象限,就可以一一对应进行分析了。

从公司股权结构看,万里数据库算是国内较早一批从事分布式数据库研发的厂商,成立于2000年10月24日。据工信部数据库发展白皮书2021显示,国产数据库企业成立年限超过10年的不足50%,而成立20年以上的数据库企业只有十四家,万里数据库就属于其中一家。

从天眼查可以查到,万里数据库是一家背景“清白”的独立数据库企业,并没有外资背景,也没有与任何一家云厂商绑定。这对于企业多云异构的复杂环境有适用性、中立性。国外当红炸子鸡Snowflake,已经证明了中立性的价值。

重磅丨赛迪数据库市场研究报告,最大黑马竟是它?


“未来,国内数据库市场会形成至少2个梯队。第1梯队是互联网巨头,万里数据库的目标是做第2梯队领头羊。为什么除了互联网巨头之外,还能有第2梯队?因为,客户替换是为了避免被外资大厂绑定,同样,也不愿意接下来被另外的巨头绑定,这就给万里数据库这样的独立数据库厂商提供了市场空间。”


这是去年,万里数据库联合创始人林韶宾在接受我的采访时说过的一段话。其中就提到了中立性这点。

天眼查显示,万里数据库旗下有且仅有唯一一个全资子公司,即北京拓林思软件有限公司(Turbolinux),是国内最早一批从事Linux产品化的公司。

这说明,万里数据库在基础软件领域很早就开始布局国产替代市场,有着较深的技术积累和国内商业化的认知,否则不会存活到现在。这与近几年跟随风口疯狂入场的一些新兴数据库公司,有着本质区别。


从产品安全等级看,万里数据库是否符合国产化要求?具体到行业,如:万里数据库是否符合金融国产化要求,相关资质是否齐全?

从公众号、网站等公开资料可以了解到,万里数据库自2018年开始与国产芯片、操作系统、服务器、中间件等国产软硬件开展兼容适配。目前,万里的数据库已兼容所有主流的国产软硬件。

万里数据库先后通过了中国人民银行、中国电科院、中国软件评测中心等行业及业内权威的安全等级测试认证,并且产品在金融、运营商、能源等行业有较大规模的落地。

这说明万里数据库满足国家安全标准与用户安全标准。通过安全等级测试是一方面,更具说服力的是在金融、运营商、能源等行业头部企业中有较大规模的落地实践,这能说明很多问题。


从客户类型及应用案例看,客户类型及案例能有效证明产品的安全性。赛迪报告中虽未直接披露厂商和产品,但从案例架构图中,不难找到万里数据库的身影。客观地说,对于没有国家队背景的万里数据库而言,活着且越活越好,并不是一件容易的事。

虽然,万里数据库的商业模式与大部分数据库厂商没有区别,主要以售卖License为主。但万里数据库针对头部客户采用灵活的联合研发模式,我认为,这才是万里数据库能够敲开金融、运营商、能源等行业客户,并迅速铺开的主要原因。

联合研发的案例并不难发现:

  • 2019年,万里数据库与国家电网联合发布“思极有容”数据库;

  • 2020年,与联通沃音乐联合研发海纳数据智能平台uniBase;

售卖License的案例,如:2020年,万里数据库中标了中移动OLTP数据库联合创新项目,在业内一鸣惊人。

毫无疑问,万里数据库的主要用户都是国内关键应用领域中的头部企业。如前所述,如果万里数据库的产品不符合国家电网、中国移动等行业巨头的应用标准,它凭什么中标?没国家队身份的它又凭什么活着?

从产品架构看,去年,我对万里数据库联合创始人林韶宾的专访中已经提及(详见:万里数据库是一家怎样的公司?)

GreatDB采用原生分布式架构、基于多数派协议+数据冗余实现高可靠,基于两阶段提交协议+DTM实现分布式事务ACID、集群架构全组件按需高可扩展

GreatDB还针对中国企业级市场的需求改进了事务模型,从吞吐和延时两个维度改进了性能。从用户角度出发,对原生分布式数据库进行了增强。

因此,从产品架构上,万里数据库的原生分布式架构具有一定技术领先性。


从技术路线看,万里数据库基于MySQL技术路线进行自主研发,这与其技术优势直接相关。万里数据库技术团队为前MySQL中国研发中心及服务中心,先后与MySQL AB、SUN、Oracle合作研发过MySQL核心代码。

万里数据库对MySQL主要有以下贡献:

Replication功能开发、NDB Cluster功能开发、Bug修复、中文手册编译等。显然,在MySQL技术路线上,万里数据库有很深的技术积累而非浮于表面,这是其核心竞争力的体现。

众所周知,国产数据库多数基于MySQL和PostgreSQL二次开发而来,利用开源技术缩短与国外头部企业的差距无可厚非。事实上,不仅在国内,国外也一样。以下列出的都是基于MySQL开发的产品,其中就包含大众所熟知的国外的AWS Aurora。

重磅丨赛迪数据库市场研究报告,最大黑马竟是它?


(来源:Database of Database 网站)


但是,如我一直强调的,利用开源技术不等于完全依靠开源技术,应该在开源技术上有着自己的创新。掌握核心能力,不是在开源技术上穿个“衣”带个“帽”就号称自研、自主可控。

这点,万里数据库相比国内其它一些厂商的含糊其辞,要实在些,并不掩饰自己产品基于MySQL技术路线的事实,想必这份自信也是源于其多年自主研发经验及对MySQL核心技术的掌控。并且,万里数据库还兼具目前流行的开源技术路线。


2021年,万里数据库将其多年技术积累进行了开源,推出GreatSQL社区。

基于国内已经形成庞大的围绕MySQL软件生态和人才生态的事实,搭建一个独立自主的国内MySQL分支社区,其现实意义已在业界形成广泛共识。

当然,分支社区搭建容易搞活难,GreatSQL社区未来发展还有待观察,但GreatSQL社区2021年已被评为“Gitee最有价值开源项目”,可见其潜力还是被业内认可的。

目前,国内数据库分支社区做的成功的不是没有,比如openGauss就做得风生水起,不过它是基于PostgreSQL技术路线。


从服务体系看,服务很重要。因为,大部分应用企业在MySQL数据库方面的故障解决能力、企业级数据服务支撑能力是不足的,维护团队规模也不大。

从趋势看,专业化服务是当前数据库市场的主要发展趋势。


什么是专业化服务?

举个例子,虽然Oracle贵,服务也贵,但绝对是专业服务的典范。一个电话过去,Oracle派团队过来驻场一个月,调试-测试-出报告,甚至会将配置哪里错了、哪里可以优化、哪些工具可以用来继续监测等都讲得清清楚楚。甚至不是Oracle的问题,也会顺手提出来,这就是专业化服务。

但是,专业化技术服务能力并不等于“搬砖”能力,其源动力是企业的技术能力水平。解决当前国产化替换的关键是技术掌控,而不是堆人。当然,堆人是一种态度,也能解决表面问题,但最核心的仍是对技术的掌控。

万里数据库是少数几家接受我采访时,主动谈到测试方法论和工具的厂商。数据库研发过程中最大的痛点不是解决问题,而是发现并重现问题。


如何保障产品的稳定性?

涉及分布式产品的测试,与以往单机不同。分布式架构有许多故障组合,尤其是机器多了以后,计算、存储节点包含对上下游工具的兼容等都会导致一系列行为的不同。

为此,万里数据库倒腾出了一个厉害的东西“混沌测试工具DBomb”。这个东西,我只有在采访高斯实验室和Oracle时才听过。所以,万里数据库在解决产品技术问题方面是有其独到之处的,这不是刚刚成立三五年的数据库厂商可以做到的。

重磅丨赛迪数据库市场研究报告,最大黑马竟是它?


综上所述, 无论是从公司技术团队背景、产品、成功案例可移植性以及技术服务能力,万里数据库都表现得全面且均衡。因此,能进入到领导者象限,也就不难理解了