数字经济浪潮下,越来越多的企业管理者开始意识到数据资产的重要性,并为此不断加速企业的数字化转型与升级。而在数据库领域,云原生已经当仁不让地成为了当下最炙手可热的技术趋势之一。
那么在云原生的时代大潮之下,数据库领域未来将面临怎样的技术发展趋势?数据库企业又应如何抓住其中的机会加以布局?
近期,北京飞轮数据科技有限公司的华东区总监辛明旺接受了动点科技的采访,分享了云原生数据库细分赛道头部企业的技术实践、业务经验以及对整个云原生数据库市场前景的深刻洞察。2022年,这家成立未满一年的云数仓企业超越ClickHouse,摘得了分析型数据库性能排行榜ClickBench榜首的桂冠。
数据分析的算力引擎
当前,市面上的数据库产品可大致分为关系型数据库和非关系型数据库两类。其中,关系型数据库的市场份额占比达80%以上,是名副其实的老大哥。关系型数据库又分为交易型数据库(OLTP)和分析型数据库(OLAP)等类型,前者对数据进行重组,后者对数据进行分析,并供企业进行应用与消费。
在互联网的推动下,数据的应用场景在不断走向个性化、实时化,越来越多的行业都对实时场景的分析需求提出了更高的要求,例如互联网行业精准营销、客户报表、实时订单分析、实时多维分析,金融行业的实时风控、反欺诈、智能投顾,制造业的实时物流、仓储监控等等。作为一家云原生分析型数据库企业,飞轮数据(SelectDB)就在为这样的实时大数据分析与处理需求提供产品支持。
基于企业不同的需求,飞轮数据为企业提供SelectDB Enterprise和SelectDB Cloud两个不同的产品版本。SelectDB Enterprise通过本地软件交付,部署在企业客户的IDC、私有云/专有云VPC,可以运行在裸金属服务器、虚拟机、K8S,提供一系列便捷的管理与开发工具、企业级特性和专业的企业级技术支持;SelectDB Cloud基于存算分离的云原生架构创新研发,公有云交付,提供全托管实时云原生数据仓库服务,是国内首个多云中立的数据仓库产品,目前已在阿里云、腾讯云、华为云、AWS上开通。
同时,飞轮数据也提供面向企业内部的现代化数据平台、面向外部客户的报表与分析、用户画像与行为分析解决方案、日志存储和分析解决方案四大解决方案。
当前,飞轮数据的客户群体广泛地分布于各行各业:如泛互联网(电商、游戏、直播、短视频、生活服务平台等)、金融、零售、房地产、制造、供应链、物流、政务等等。基于开源版本Doris和商业化产品SelectDB,飞轮数据已经服务了来自各行各业的约2000家客户,预计到2023年底总客户量将增加至一万多家。
定位实时业务需求
随着云平台基础设施的逐步完善以及大量用户对云服务的逐步认可,各种基于云平台的软件服务将迎来全面爆发,数据库软件也将从把原来私有化部署的软件在公有云上用几台虚拟机托管就提供服务的方式,逐步转变为基于云原生从头设计、与云深度结合的云服务的方式。
辛明旺认为,云原生数据库应当从依托开源、多云中立、极致弹性和极简易用等方面构建竞争壁垒。就飞轮数据而言,“实时”是其立足于市场最核心的定位和优势,SelectDB的产品具备端到端实时数据集成、存储和查询的通用能力,能够满足不同行业中企业用户各类实时场景的需求。与普通的数据仓库相比,SelectDB能够提供T+0的实时能力,可以实现万级并发毫秒级延迟的查询能力。
在一些场景中,SelectDB的实时性能已超越ClickHouse、Snowflake、Redshift、Hive、Spark等业界标杆产品,可实现对其实时功能的替代:2022年,在全球知名的分析型数据库测评榜单ClickBench上,SelectDB的性能击败Snowflake、Redshift等同类型产品,取得了世界第一。
其中,在两个最典型的数据分析场景中,SelectDB展现出了遥遥领先的优势:单表聚合场景下,SelectDB的性能是ClickHouse的3.4倍,是Presto的91倍,是Snowflake的6倍(使用SSB-flat测试);在多表关联场景下,SelectDB Cloud的性能可达到Redshift的1.5倍、ClickHouse的49倍、Snowflake的2.5倍(使用TPC-H sf100测试)。在使用SSB数据集的标准测试中,SelectDB的查询性能达到了Hive的54倍、Spark的12倍。
除了云原生化,Serverless也是数据库行业一大重要的技术趋势。Serverless即“无服务器”,具有免运维、弹性伸缩、按需付费、高可用等特质。这种架构思想和服务模型,可以让开发者无需关心基础设施(服务器等),而是专注到应用程序的业务逻辑上。
据辛明旺透露,SelectDB很早就开启了Serverless的布局并提供客户自主的轻量化服务。同时,SelectDB还将通过生态合作的形式携手领域内的伙伴加深对Serverless的探索。
今年3月,SelectDB成为了阿里云瑶池数据库在国内的首个战略合作厂商。基于本次合作,飞轮预计在2023年下半年发布“阿里云SelectDB版本”,在共创中双方将重点围绕Serverless展开探索,加速从Fully Managed走向更加云原生的Serverless化,进一步增强自动弹性扩展、按量付费的全新便捷体验。
产品力引领规模增长
IDC报告显示,2021年国内公有云关系型数据库市场的前八强中有5家为中国厂商,合计占超74%的市场份额。在本土做大做强后,出海成为国内厂商的全新增长逻辑。
作为一名刚刚进军海外市场的玩家,SelectDB也分享了自己的一些经验。“进入全球市场进行竞争,不仅可以进入一个更广阔的市场空间赚取收入,也会提升中国企业软件的竞争力。未来一个伟大的数据库软件和服务一定是全球化的。”
辛明旺指出,中国的数据库出海,一定要提升产品化程度。“当前的很多数据库产品也许能在一些benchmark下跑出全球第一,但其可靠性、易用性、稳定性等产品化能力还很弱。就如同要造一辆车,也许我们的引擎还行,但是整个车产品化还比较差。我们不能说交付一个产品,总是依赖一个强大的工程师团队去修复问题,去弥补产品应该做好的能力。要从做项目,做支持服务转变到提升产品自身的竞争力。即使在国内,随着工程师人力成本的提升,这种模式也不可持续。”
数据库行业坡长雪厚,2021年市场规模已达700亿美元。但同时,作为一种通用基础软件,数据库具有显著的赢家通吃效应,是企业服务领域竞争最为激烈的赛道。辛明旺预测,未来,无论是事务型数据库还是分析型数据库,各自的赛道中都将逐渐涌现出前三位的数据库产品并占据80%的市场份额。