【技术分享】从DB-Engines与墨天轮中国数据库排行榜对比看国产数据库发展现状

发布日期:2023-07-28


本文为网思科技信息技术服务部DBA总监尹海文原创,并于墨天轮社区发表,欢迎大家交流、讨论。如需转载请联系作者或墨天轮官方。


想要了解数据库行业的发展现状,无论是开发人员还是DBA,最方便的方法之一就是通过各类排行榜。在这方面,国际上广为人知的DB-Engines数据库流行度排行榜和国内的墨天轮中国数据库流行度排行榜是最为著名的。尽管二者存在一些不同,但也存在一些关联。本文将结合最新一月的墨天轮排名与最新的DB-Engines排名对比,以分析国产数据库的发展现状。


#0  DB-Engines简介



DB-Engines 创建于 2012 年 10 月,由奥地利 IT 咨询公司 solid IT 创建和维护,根据当前流行程度(全文简称“DB-Engines排名”)数据库管理系统进行排名的列表。该列表每月更新一次。


DB-Engines 介绍可浏览:https://db-engines.com/en/

DBEngines.png

图为网站DB-Engines介绍节选


该流行度排行主要依据数据库产品在搜索引擎的被提及次数、搜索趋势及招聘数量等维度计分,主要可参考《排行榜|当 DB-Engines 遇见墨天轮国产数据库排行》一文中的整理(链接:https://www.modb.pro/db/109350),以下为指标截图:



1. DB-Engines简介.png


#0  墨天轮中国数据库流行度排行


墨天轮国产数据库流行度(全文简称“墨天轮排名”)排行于2019年6月推出,通过近50个维度的数据来考察近300个国产数据库的流行度排行,每月1日更新排行数据,用于体现国产数据库在互联网上的流行度。

主页链接为:https://www.modb.pro/dbRank

摩天轮排名.png

图为墨天轮排名网站内容截取

该榜单主要根据百度、必应、谷歌以及微信公众号文章(搜狗)等搜索引擎的内容条目数,数据库关键字趋势指数,3方测评、专利、论文、招聘岗位数等指标进行计分,其计分规则具体说明请查看:https://www.modb.pro/db/189802

目录.png

图为网站计分规则说明目录


#0  榜单对比



 
   首先需要明确的是,DB-Engines和墨天轮在数据库排名方面采用了不同的统计范围和计分规则。因此,我们只能通过一些表象来做出一些简单的分析,希望能为大家思考国产数据库行业的发展提供一个新的角度。


    3.1 TOP 10对比

DB-Engines前十数据库模型相对多样,有关系型、键值、文档、搜索引擎等大多数主流模型数据库。


3.1 TOP10对比.png

与墨天轮排名相比,前十名大多是关系型分布式数据库,这表明国产数据库主要集中在关系型数据库领域,并且主要用于替代中大型在线事务处理(OLTP)场景所需的相关业务。这意味着国产数据库期望在重要行业的核心业务领域,如运营商计费、大规模电子商务、互联网金融、银行等领域取得成功。

3.1 TOP10对比2.png

3.2 收录总量与主流数据库模型对比

3.2 收录总量对比.png

(这里仅对DB-Engines和墨天轮排名中的主流数据库模型分类进行对比,关于所有分类详情请至对应网页查看)

数据库收录总量来看,DB-Engines收集全球范围内的数据库数量,其收录数量远大于墨天轮排名,这主要是因为DB-Engines成榜时间较早且国外数据库发展已逾半个世纪,数量庞大;另一方面墨天轮排名收录的均为国产数据库,而国产数据库的蓬勃发展暂时只有几年时间。

基于全球流行度的原因,DB-Engines仅收录了国产数据库中的很少数量,总数约为13个(由于榜单较为庞大且收录语言有所不同,可能存在遗留)。

数据库模型占比来看,两个排行榜中关系型数据库仍然占据了主导地位,但是DB-Engines中关系型数据库的比例明显较低,除时序、向量和图数据库之外其他类型数据库的比例是远高于国产相关产品的,国产数据库在数据库多样性上还有巨大的差距。(这里需要注意很多数据库的多模式数据类型属性,故分类总和是大于总量的)

同时从分类总数来看,DB-Engines也更多,这也意味着DB-Engines覆盖了更多的数据库类型与其涉及的应用场景。细看数据库类型,国产数据库仍然倾向于OLTP的主航道和新兴航道,仍需要进一步扩展数据库的模型数量以求更加全面的覆盖业务需求。


#0 入围DB-Engines的国产数据库


    4.1 TiDB数据库

4.1 TiDB1.png图为TiDB数据库于DB-Engines的排名截图

4.1 TiDB2.png图为TiDB数据库于墨天轮排名截图


(产品百科:https://www.modb.pro/wiki/20

DB-Engines初次上榜时间:2017年5月,最高得分3.856

作为一段时间内DB-Engines排名中国产数据库的独苗(已在榜超过5年),PingCAPTiDB在墨天轮排名中一直名列前茅,期间也有很长一段时间霸榜第一。作为一款自研云原生分布式金融级高可用HTAP关系型数据库,兼容MySQL协议和生态。虽然近期在DB-Engines排名有所下滑,但仍是DB-Engines排行榜中的国产数据库第一,不得不说TiDB是第一个走向国际的“国产之光”。

4.2 OceanBase数据库

4.2OceanBase1.png

图为OceanBase数据库于DB-Engines的排名截图

4.2OceanBase2.png

图为OceanBase据库于墨天轮排名截图

(产品百科:https://www.modb.pro/wiki/34

DB-Engines初次上榜时间:2022年6月,最高得分2.854。

墨天轮排名的本月状元OceanBase,在DB-Engines中排名121,相较于1年前上升75名,相较于上个月提升9个名次,涨势喜人。OceanBase 数据库是阿里巴巴和蚂蚁集团不基于任何开源产品、完全自研的原生分布式关系数据库。拥有支持金融级高可用、HTAP混合负载、超大规模集群水平扩展、主流商业和开源数据库兼容等优势。OceanBase,经过淘宝天猫这样大型电商平台的严峻考验,已经证明其在国内、国际数据库行业中具备着非常广阔的前景。

4.3 GBase数据库

4.3.png

图为GBase数据库于DB-Engines的排名截图

4.3-2.png

图为GBase据库于墨天轮排名截图

(产品百科:https://www.modb.pro/wiki/26

DB-Engines初次上榜时间:2018年9月,最高得分1.686。

墨天轮本月第八名来自于南大通用的GBase数据库,相较于半年前上升一名,在DB-Engines中排名183,相较于上个月提升14名,同样实现了双榜双涨。作为自主研发的国产数据库系列品牌,GBase系列数据库产品包括分布式逻辑数据仓库GBase 8a、基于共享存储的数据库集群GBase 8s、多模多态分布式数据库GBase 8c等,能通过不同产品解决不同的数据库应用场景。

4.4 openGauss数据库

4.4 openGauss1.png

图为openGauss数据库于DB-Engines的排名截图

4.4 openGauss2.png

图为openGauss据库于墨天轮排名截图

(产品百科:https://www.modb.pro/wiki/601

DB-Engines初次上榜时间:2022年5月,最高得分1.55。

墨天轮本月探花openGauss,在DB-Engines中排名187,从其近一年的发展来看排名是不断提升的,共提升22名。openGauss是华为基于PostgreSQL 9.2.4开发并开源的关系型数据库,具有高性能、高可用、高安全、易运维、全开放等核心特性。在华为、社区、下游厂商的共同努力下,不断进步与发展。

4.5 Alibaba Cloud数据库

4.5 alibaba.png

图为Alibaba Cloud数据库于DB-Engines的排名截图



图为Alibaba Cloud据库于墨天轮排名截图

DB-Engines:

Alibaba Cloud MaxCompute 初次上榜时间:2017年8月,最高得分0.927。

Alibaba Cloud AnalyticDB for MySQL 初次上榜时间:2020年3月,最高得分0.887。

Alibaba Cloud AnalyticDB for PostgreSQL 初次上榜时间:2017年8月,最高得分0.672。

Alibaba Cloud ApsaraDB for PolarDB 初次上榜时间:2020年5月,最高得分0.714。

Alibaba Cloud Log Service 初次上榜时间:2020年5月,最高得分0.602。

Alibaba Cloud Table Store 初次上榜时间:2017年8月,最高得分0.502。

Alibaba Cloud TSDB 初次上榜时间:2020年3月,最高得分0.489。

阿里云是DB-Engines排名中上榜最多的国产数据库厂商,共有7款数据库上榜,其中4款关系型数据库、1款搜索引擎、1款列存数据库、1款时序数据库。这三款来自中国的非关系型数据库产品因其不同的模型而一同入选榜单,实属不易。然而,更值得一提的是这三款产品均为云上产品,这充分说明了阿里云在国际市场上的扩展能力。

对比墨天轮排名:

PolarDB也进入前五,作为阿里巴巴自主研发的下一代关系型分布式云原生数据库,100%兼容MySQL、PostgreSQL、高度兼容Oracle语法,拥有MySQL引擎、O引擎、PostgreSQL引擎3个子产品。

(产品百科:https://www.modb.pro/wiki/37

AnalyticDB也进入前十,是阿里云自主研发的云原生数据仓库,采用存储计算分离+多副本架构,支持最大5000节点规模的弹性扩容,对复杂SQL查询速度比传统的关系型数据库快10倍以上。AnalyticDB高度兼容MySQL、PostgreSQL,Oracle应用,迁移成本低,可对万亿级别的数据进行实时的多维度分析透视,极大地提升了企业挖掘数据价值效率。拥有for MySQL和for PostgreSQL两个版本。

(产品百科:https://www.modb.pro/wiki/87

Aliababa TSDB则排名41的,相较于上个月大幅提升6名。Time Series Database ,简称 TSDB 是一种集时序数据高效读写,压缩存储,实时计算能力为一体的数据库服务,可广泛应用于物联网和互联网领域,实现对设备及业务服务的实时监控,实时预测告警。

(产品百科:https://www.modb.pro/wiki/477

4.6 Kingbase数据库

4.6kingbase1.png

图为Kingbase数据库于DB-Engines的排名截图

4.6kingbase2.png图为Kingbase据库于墨天轮排名截图

(产品百科:https://www.modb.pro/wiki/13

DB-Engines初次上榜时间:2021年9月,最高得分0.764。

国内老牌数据库厂商人大金仓,本月墨天轮排名第七,DB-Engines相较于上个月提升6位来到了259名。作为一款面向大规模并发交易处理的企业级关系型数据库。该产品支持严格的ACID特性、结合多核架构的极致性能、行业最高的安全标准,以及完备的高可用方案,并提供可覆盖迁移、开发及运维管理全使用周期的智能便捷工具。

4.7 AntDB数据库

4.7 AntDB1.png

图为AntDB数据库于DB-Engines的排名截图

4.7 AntDB2.png

图为AntDB据库于墨天轮排名截图

(产品百科:https://www.modb.pro/wiki/55

DB-Engines初次上榜时间:2023年2月,最高得分0.345。

墨天轮涨势喜人的AntDB,本月在DB-Engines排名位列321,相较于上个月的340名进步18位同样涨势喜人。AntDB 是亚信科技出品的一款通用企业级、高可用、高性能的原生分布式关系型数据库,具有HTAP混合负载、广泛的语法兼容、一键进行迁移、在线弹性扩容、内核级读写分离、数据安全可靠等特性。


#0  笔者总结

在数据库国产化大趋势的背景下,国产数据库的发展形式是喜人的。部分国产数据库也冲出了国门走向了世界,从一支独苗走向了集群冲锋,扩展了中国软件行业在全球的影响力。

但是不得不说国产数据库与国际上主流的商业、开源数据库之间还有不小的差距,尤其是以下一些问题:

  • 数据库的高性能,尤其是在大数据量、大规模并发的情况下,国产数据库需要展现出与主流商业数据库如Oracle一样的高性能发挥和快速的响应效率;

  • 数据库的稳定性,在数据量不断增大、业务规模不断扩大、数据库本身也越来越庞大的情况下,确保数据库本身的安全稳定运行的同时也应确保数据库有一如既往稳定的性能表现;

  • 数据库的兼容性,数据库的变更带来的数据库特性、语法的改变,可能要求业务代码进行极大的改变,需要数据库厂商努力减少数据库中不兼容的内容;

  • 生态建设当前许多国产数据库的生态建设存在问题,虽然并非完全封闭,但相对不够开放。这对于扩展开发和维护团队的规模以及与复杂业务场景和其他类型数据库的适配过程带来了不利影响,需要加以改进;

  • 分布式数据库的引入,要求业务从业务逻辑设计、数据库库表设计上进行分布式改造,导致更大规模的代码侵入,引发业务侧的强烈反弹,数据库与开发、存量业务之间的矛盾难以调和,这一点也需要强大的生态建设;

  • 数据库行业的环境(也是很多行业的环境)是百花齐放与自相残杀并存的,很多国产数据库厂商内心浮躁、目标简单或不明,同时过多厂商的竞争也造成了融资方面的困难。

但是相信在大家的共同努力下,终将实现国产化数据库的跨越式发展,这里也对数据库国产化发展提出一些建业,也算是愿景:

  • 各数据库厂商应该保持谦虚与冷静,专注于改进和优化数据产品的质量。在面对竞争对手时,应该展现包容并蓄的心态,相互学习,以推动整个行业的进步;

  • 加强数据库生态建设,无论是开源还是商业数据库,都应该以更开放的态度面对IT行业从业者以求整个IT行业向国产化转变,同时摒弃壁垒、加强友商合作特别是优势互补;

  • 从高校出发加强数学等基础学科教育投入与人才培养,力求从更底层的地方做好数据库。