商业银行分布式数据库的应用现状及其选型策略简析——附8家行应用实践

来源:BanTech智库
作者:BanTech智库 焦卢玲
在新兴技术飞速发展及融合创新不断深化的当下,随着客户个性化服务需求的猛增、银行集约化经营模式的转变,以及安全可控国家战略的实施,银行核心系统数据库的扩容和运维压力日益凸显。我们看到商业银行已经在重新审视集中式数据库的演进之路,多重因素共同驱使银行积极探索和实践数据库架构转型。与此同时,随着数字化转型的深入推进,以银行为代表的金融企业业务架构发生巨大变化,加速构建“敏态+稳态”双轮驱动的创新模式,而作为数据承载工具的分布式数据库,近年来得以快速发展、产品成熟度易取得较大提升,并以其满足行业关键应用的高可用性、高可扩展性、高并发以及软硬件解耦等特性为银行业数字化转型及业务创新发展提供了强有力支撑。
本文在对当前分布式数据库发展现状、商业银行选型主要考量要素等进行简要概括、分析的基础上,着重对8家银行的分布式数据库选型及实施策略、前沿实践等进行盘点、剖析,以期洞察当前商业银行分布式数据库发展现状,以及未来分布式数据库在银行业的应用前景。
一、分布式数据库在商业银行的应用现状及前景简析
数据库作为承担数据存储与计算的基础软件,与操作系统、中间件并列为三大基础软件。过去相当长一段时间,包括银行在内的金融机构主要采用的是“大、小型机+集中式数据库系统”这样的传统架构。但随着移动互联、云计算、大数据等技术的快速发展及数字经济建设持续提速,金融业务线上化和服务场景生态化加速,数据规模及数据使用复杂度不断增加,应用系统面临处理高并发、大数据量、超高峰值等挑战,传统集中式数据库不易扩展、难以满足存储与计算海量数据要求等弊端逐渐显现。分布式数据库凭借在海量数据存储上所具备的显著优势,近年来得以快速发展,市场规模保持较高的增速。从商业银行的视角来看,金融业加快分布式数据库建设的主要原因如下:
一是从政策驱动来看,根据人民银行发布的《金融科技(FinTech)发展规划(2019-2021年)》,我国将有计划、分步骤地稳妥推动分布式数据库产品先行先试,形成可借鉴、能推广的典型案例和解决方案,为分布式数据库在金融领域的全面应用探明路径,确保分布式数据库在金融领域稳妥应用。除此之外,2020年11月,人民银行又正式发布《分布式数据库技术金融应用规范》(JR/T 0204-2020),从技术架构、安全技术、灾难恢复三个方面,构建了一整套分布式数据库技术金融应用的系列标准,这也为推动分布式数据库落地金融行业奠定了基础。因此,积极推进基于分布式应用和分布式数据库等技术的架构升级,有效满足金融业务系统敏捷开发、稳定可靠、弹性伸缩等升级要求,已经成为银行业金融机构数字化转型过程中的重要共识。
二是从行业数字化转型趋势来看,当前,大中型银行数字化转型已步入深化期,中小银行亦普遍开始加快数字化转型进程,数字化正成为金融企业运营的关键能力。而数据作为数字化运营的核心要素,如何借助数据敏捷地优化业务模式,提升资源配置以及风险防控能力,成为决定数字化转型成效的关键环节之一,因此,随着数字化转型步伐的加快,相应地也对数据库提出了更高的要求。
三是从业务支撑角度来看,随着数字化转型步伐的加快,传统集中式数据库系统越发难以满足金融机构的业务创新发展需求,向分布式数据库转化已成市场趋势。以手机银行为例,目前大众通过手机银行办理业务的场景越来越多,而这类业务场景往往对数据并发、读写效率,以及数据复杂化和海量数据处理能力提出更高要求,也就给分布式数据库提供了广阔的应用空间,从而推动行业对分布式数据库的潜在需求。
四是从数据量增长情况来看,数据量爆发式增长催生了对海量数据的分析需求,从而带来数据库市场快速发展的新机遇。随着智能移动手机的普及、云计算等新兴技术的快速发展,以及大众消费行为线上化迁移步伐的加快,数据量呈指数级增长态势。而数据量的快速上升,使得大数据分析需求的重要性逐步显现,传统的关系型数据库在高并发、分析等方面存在一定的劣势,应运而生的分布式数据库能够较好地满足大数据分析的需求,或形成数据库市场新的增量。
目前,分布式数据库已经初步形成包括分析型、事务型、关系型、非关系型、混合型等在内的完善产品体系。而分布式数据库在金融业的应用亦取得较大进展,包括国有大行、股份制银行、城商行等在内的金融机构纷纷加快了分布式数据库在核心业务系统的改造落地,不管是在互联网新核心业务,还是传统核心业务中,分布式数据库行业应用落地数量大幅增加,应用前景越发广阔。未来,随着行业核心业务系统分布式改造的加快,金融领域分布式数据库的改造规模及潜力也将进一步加速释放。
二、商业银行分布式数据库选型的主要考量要素
目前我国市场中的数据库无论是产品、方案和生态均渐趋丰富和多样化,呈现“百花齐放”的发展态势。首先,从市场参与者来看,既有云上数据库产品提供者,如以阿里云、腾讯云、百度云和金山云为代表的CSP(云服务提供商);又有以中兴、南大通用等为代表的国内较早一批深耕数据库市场的企业;同时市场中也涌现出一批新型的数据库厂商如PingCap、星环科技、巨杉数据库等;也有如新华三等推出了基于开源数据库的产品和解决方案的传统科技企业;其次,从产品和方案的角度看,目前市场上既有OLAP(事务型)产品和方案,也有Oceanbase、PingCap这种基于MySQL开源分布式数据库开发、主要面向OLTP(交易型)以及由此延伸出的融合了交易型数据库和分析型数据库特点的HTAP(混合事务/分析处理)数据库需求的产品和方案。
面对多样化的选择空间,作为对应用场景、技术条件和关键诉求方面较为严苛的金融行业,做好技术选型与分析决策是决定分布式数据库能否成功落地实施的关键。因此,商业银行在推进传统的集中式数据库向分布式数据库转型和改造的过程中,如何依据自身实际选择相契合的分布式数据库、前瞻规划实施路径,以更好承载海量数据高效存储和弹性扩展,在支撑业务快速发展的同时,实现低成本、高并发、高性能、高可靠、高可用等,成为商业银行在进行分布式选型以及推进分布式数据库转型时需考量的核心要素,具体如下:
一是业务支撑能力。首先,金融行业多元化的数据使用场景对数据库提出了较高要求,其应具备企业级的业务支撑能力,支持高并发、可扩展和海量数据库存储及访问;其次,从业务场景层面来看,金融行业应当在分布式事务、数据强一致性、混合负载等方面考量分布式数据库,以充分发挥分布式数据库在这些场景应用方面的优势。
二是数据可用性。包括如数据一致性、业务连续性及数据安全性等方面。首先,数据一致性,金融核心业务往往要求数据库必须支持强一致性方案以优先保证数据正确性;其次,业务连续性,金融行业分布式数据库在多数据中心部署后,要确保数据在灾难发生的情况下不丢失,系统的局部故障不会引起整个系统的崩溃或全局失控,以确保业务的连续性;此外,数据安全性,混合业务负载以及分布式数据库具有更好的“适配性”也是技术选型中需着重考量的要点之一。
三是投入成本。技术的升级迭代应以服务业务为最终目标,但也需综合考量成本及收益。对于金融行业而言,分布式数据库的选型除应关注场景应用和技术能力问题外,还需综合考虑成本因素。其中硬件成本方面,主要取决于金融行业部署的分布式数据库所需的服务器集群规模、数据量以及数据库自身对硬件的要求等;软件成本方面,主要是采购分布式数据库软件所需的成本;开发测试成本方面,主要是金融企业对数据库进行改造或者更换后,还需要完成必要的开发测试环节以确保分布式数据库的“可用性”;运营维护成本方面,主要包含为满足升级和改造数据库所带来的数据迁移成本和上线之后的日常维护运营成本等。总之,分布式数据库的转型应能大幅降低使用成本,如使用“廉价x86硬件基础设施+廉价存储+开源软件+自研”的模式去逐步提升自主可控能力,这样一方面可以降低对商业产品的依赖、拥抱开源产品,另一方面相比商业产品可大幅节约企业投入。
四是智能运维能力。数据库作为分布式核心系统的心脏,应支持与自身系统进行适配性定制,提升数据库的运维自动化和智能化能力,以更好支撑未来业务敏捷创新和持续健康发展。
五是基础设施契合度。核心业务系统是金融行业最为重要的业务系统模块,不仅对数据库提出较高要求,同时要求基础设施能够提供高可用性、高稳定性和高可扩展性等性能,尤其是时下越来越多的新型金融服务模式和渠道,要求底层提供的关键数据中心基础设施能够支持线性扩展性能与提供足够大的存储容量等。此外,越来越多的金融企业也正在将基于x86环境的分布式架构替代以往的大、小机型环境的集中式架构,并逐步开始迁移各类应用到云平台之上,实现数据与业务的分离,因此如何在保持接口兼容性和数据一致性的前提下,实现云化基础设施的改造和升级,以方便后期提供更为强大的分布式计算和存储的服务能力,同样也是保证分布式数据库平稳落地金融行业的重中之重。
六是兼顾项目整体目标。分布式数据库的产品选型要服从于项目整体目标。局部最优的选择拼装在一起未必是全局最优的方案。因此,要从整体上评估技术复杂度、工程实施,以及研发团队所具备的技术开发能力等因素,而不是仅选择局部最合理的方案。
七是交付时效。先进的产品可能会延长项目交付时间,因此,在选择分布式数据库产品时需衡量项目进度及远期目标要求等。
八是业务流程变更。产品选型可能会引起业务流程的变更,进而导致协作范围扩大、增加实施难度等,因此,需兼顾产品选型对业务与流程变更的影响。
九是关注技术潮流。分布式数据库的选型应评估技术潮流的影响,必须能够独立对技术发展趋势做出研判,保持对新技术的敏感度和掌控力,切勿一意孤行或是盲目跟风。
由上述分析可见,金融行业在加速分布式数据库解决方案落地的同时,也伴随着一系列需要统筹兼顾的问题,因此金融行业未来如何更好地以低成本、高效率的方式构建可弹性扩展、敏捷交付的分布式数据库系统,同时保持基础设施的高可用性和稳定性等,前瞻做好选型策略至关重要。
三、分布式数据库在我国商业银行的应用案例
随着移动互联网的快速发展,大量可被计算、存储的数据随之产生,与此同时,随着各行各业数字化转型的持续推进,数据量呈爆发增长态势,给银行带来了巨大的压力,使得弹性可控的分布式架构转型成为大势所趋。在此背景下,如何选择契合自身需求的分布式数据库,在业务支撑方面承载海量数据高效存储和弹性扩展的同时,具备低成本、高并发、高性能、高可靠、高可用的能力,成为商业银行推进数据库这一关键IT基础设施创新升级过程中的重要课题。
近年来,随着我国数据库产品和解决方案的日益丰富和成熟,已陆续在包括国有大行、股份制银行及城商行、农商行等在内的商业银行的核心业务系统投产并稳定运行。同时,基于银行业严苛的稳定性、可靠性要求,部分大型银行在选择国产分布式数据库时会选择相对保守的策略,在前几年商用数据库金融场景实践不足时,部分大型商业银行选择了更稳妥的方式,例如“分布式中间件+开源单体数据库”或“单元化+单体数据库”的方式实施了分布式架构的转型;也有部分体量庞大的先行者,例如交通银行、中信银行、建设银行,选择联合研发分布式数据库,如交通银行与高校联合研发的“CBase”,中信银行与中兴通讯联合研发的“GoldenDB”等,都可作为大体量银行分布式数据库领域的标杆案例。此外,中小型银行分布式数据库的应用近几年也陆续上线。
对此,本章选取工商银行、交通银行、邮储银行、中信银行、光大银行、招商银行、民生银行、北京银行等部分具有代表性的银行,并对其分布式数据库选型及实施路径进行重点分析。
1.工商银行
一般来讲,业务规模的大小决定了银行对分布式数据库的需求程度,业务规模越大,对分布式数据库的需求往往也越迫切,因此,作为资产规模和用户数量均居行业领先地位的工商银行,在信息化建设及数据管理能力提升上始终走在行业前列。
工商银行在采用分布式数据库之前主要采用的数据库为Oracle和IBM的DB2,二者均为仅能采用垂直扩展方式的单体数据库。随着数字化转型的深入推进、多元化的业务发展需求及愈发严格的监管趋势,单体数据库扩展性欠缺、高并发承载能力不足等弊端逐步显现。
在此背景下,工商银行选择从单体数据库向以MySQL为基础的分库分表方案转型,采用“分布式中间件+开源单体数据库”的组合,并从2016~2017年开始调研和试点工作,2018年开始实施大规模架构改造。工商银行最终确定了基于开源MySQL的OLTP数据库解决方案,并选择了“DBLE+MySQL”的组合。之所以选择MySQL是因为其普及程度足够高,此外,由于MySQL 8.0的不成熟,所以工商银行采用了MySQL 5.7;而选择DBLE则是因为其是在MyCat的基础上开发,号称是“增强版MyCat”,且MyCat已经有较多的应用案例。该方案在最大程度上规避了数据库转型可能带来的风险,也坚定了工商银行从主机下移应用系统的决心,为后续工商银行逐步脱离对IBM主机和Oracle数据库的依赖奠定了基础。
随着工商银行数字化转型脚步的加快,2020年9月蚂蚁集团发布消息称,工商银行的主要业务系统“企业财富管理系统”近期完成了从大型机到分布式架构的转换,其中采用的分布式数据库为阿里的OceanBase,这是工商银行首次在阿里巴巴开发的数据库上运行关键业务系统,工商银行的企业财富管理系统成为了第一个转换为基于OcaenBase数据库的银行系统。
相较于OLTP,工商银行在OLAP方向上很早之前就开始布局下一代数据仓库系统在该行内部的使用。
为支撑自身的数据分析,工商银行于2002~2007年在Oracle数据库上进行了数据集市的建设,数据量达到了GB级别,以报表和专题集市分析为主辅助业务数据需要。2008年工商银行开始建设数据仓库,并引入了Teradata数据库,数据量达到了TB级别,以批量分析和灵活探查为主进行全局经营性分析。在2008~2013年工商银行引入的Teradata 5系列数据库主要用于处理批量数据,在2014年又引入了20余台Teradata 6系列数据库用于数据挖掘需求。
2014年为了解决日益增长的数据和业务创新需求,工商银行开启了下一代数据仓库的建设工作,与华为一同布局下一代EDW(Enterprise Data Warehouse, 企业级数据仓库)联合创新项目。经过工商银行2年孵化,GaussDB200于2016年开始进入商用,逐步替代Teradata数据库。2019年一季度工商银行最后一台Teradata数据库一体机下线,业务负载全面由GaussDB200承载。2019年5月,华为公司正式向外界宣布GaussDB品牌,揭开了GaussDB产品化的序幕。GaussDB200以GaussDB(DWS) 作为产品名称正式问世。根据公开报道,截至2021年6月工商银行建立了8套集群,规模达1000多个节点,工商银行的GaussDB(DWS)也成为了全球最大的金融级数仓。凭借GaussDB(DWS)优异的性能,可承载10000余位数据使用者在线探索数据,作业平均等待时间1.5min, 大幅提升了工商银行内部数据用户的使用体验。正是在工商银行的案例示范下,目前不少国内企业计划或者正在使用GaussDB(DWS) 替代Teradata数据库。
2.交通银行
为响应国家关键技术安全可控战略,交通银行从商业银行实际需求出发,积极布局、自主建设面向金融业务场景的分布式数据库系统,并稳步有序推进金融应用实践。交通银行自2013年开始对国产分布式数据库产品进行调研。总体来看,当时市场上的几款产品在数据一致性、可用性、性能和容量可线性扩展等方面,可以部分解决银行海量数据存储和高并发访问的痛点,但金融应用尚处于起步阶段,且新技术本身仍存在数据一致性不足、可靠性不够、兼容性和易用性欠缺等问题。在“底线思维、稳定生产、确保体验、重点先行、有序推进”的总体原则下,交通银行启动分布式数据库创新研制项目。
交通银行采用与高校联合研发的方式,与华东师范大学和西北工业大学共同开展研发,此后阿里巴巴也加入了该行数据库的研发,以阿里Oceanbase 0.4版本为基础,自主建设分布式数据库(以下简称“CBase”)系统。Cbase数据库是一款以原生分布式数据库技术研发和应用实践为总体建设思路,面向商业银行交易处理特性,具有事务特性的关系型数据库系统。在应用实践中,最大程度地保护现有IT应用资产,降低架构转型的风险和成本。CBase研发始于2014年,CBase数据库最先用于历史库系统的数据存储,而后逐步实现了复杂SQL语句处理和高并发事务处理能力,在供应链、贷记卡授权和网联支付等系统使用。
CBase的主要工作负载放在三类节点上,其中的数据存储节点与NewSQL风格完全一致,而剩下的SQL处理节点和事务处理节点,就是计算节点的细化。而且,CBase也基于Raft协议设计和实现了轻量级分布式选举协议,分布式事务同样是在2PC上进行改进。
目前,分布式数据库金融应用稳步有序推进,通过在交通银行12套核心业务系统中的规模化应用实践,验证了CBase已具备独立承载大型商业银行业务系统运行的能力,同时全面提升了交通银行的服务研发能力及技术支撑能力。
CBase项目践行了国家自主可控战略,深耕核心技术领域,同步研发了基础能力平台和构件,为大型商业银行应用架构转型发展探索了新路径。
3.邮储银行
作为拥有4万个覆盖城乡的实体网点和庞大用户基数的大型商业银行,邮储银行很早就开始探索分布式数据库的使用。
邮储银行起初并没有选择“真正”的分布式数据库,其核心业务系统改造方案更接近于单元化架构,设计思路是将原来商业数据库拆分成若干个小的单体数据库,分别设置对应的应用实例。邮储银行在单体数据库上选择了PostgreSQL,这在银行业中是相对较少使用的。单元化方案从应用整体来看也是一种分布式架构,通过应用层面的重构从而弱化对数据库性能和稳定性等方面的要求。
对于单元化架构而言,在每个应用程序模块中配置管理自己需要的一个或多个数据源,直接访问各个数据库,在模块内完成数据的整合。这种架构的优点是:架构相对简单,数据访问灵活;而缺点也较为明显:不够通用,数据库连接的处理复杂,对业务不够透明。
2022年4月23日,邮储银行新一代个人业务分布式核心系统全面投产上线。该系统是大型商业银行中首家同时采用企业级业务建模和分布式微服务架构,基于鲲鹏硬件底座、openGauss开源数据库与GaussDB分布式云数据库共同打造的全新个人业务核心系统,是中国银行业金融科技关键技术可控的重大实践。其中,鲲鹏、openGauss开源数据库与GaussDB分布式云数据库,作为邮储银行新一代个人业务核心系统IT数字化底座组成部分,在其中承担了先进算力平台和高性能企业级数据库的重要角色。而openGauss无论在x86还是鲲鹏上的性能对比MySQL和PostgreSQL均大幅领先,有高于其超1倍的性能优势,这得益于openGauss先进的内核根技术突破。邮储银行新一代个人业务核心系统通过企业级业务建模实现化繁为简,重塑核心交易流程;组件化模型驱动业务敏捷,从容应对市场变化与客户需求;分布式单元化部署实现弹性扩展,实时支撑业务变化;在线迁移方式实现客户无感切换,保障业务连续性,降低切换风险。
4.中信银行
中信银行与中兴通讯于2014年启动联合研发,共同完成金融级交易型分布式数据库GoldenDB的研发。
2020年7月,中兴通讯和中信银行宣布,GoldenDB 分布式数据库顺利完成在中信银行“凌云”系统的投产。在此之前,GoldenDB分布式数据库已于2019年10月26日在中信银行信用卡核心系统成功投产。中信银行信用卡核心和总行核心两大核心业务的投产切换,可以说是中国金融行业难度最高、挑战最大的核心业务数据库迁移改造工程。
GoldenDB历时五年,先后在上述两大核心业务顺利投产,这意味着中信银行和中兴通讯致力于实现中国首个大型银行分布式技术架构转型的战略目标顺利达成,GoldenDB正式成为我国金融科技发展的“新引擎”,为我国金融科技行业的发展注入新动能。而核心业务系统是银行业务的心脏,它的稳定运行无疑为其他银行树立了标杆,客观上也加快分布式数据库的普及速度。
5.光大银行
光大银行采用了双路线策略,也就是同时使用NewSQL和分库分表方案。
在云缴费系统中,光大银行使用了自研的分库分表方案。该系统的业务量非常庞大,截至2021年末,云缴费系统累计服务活跃用户5.65亿户。然而,缴费业务是银行提供服务对接用户和缴费企业,业务模型比较简单和统一,这也意味着,它对分布式事务这样的复杂操作没有那么强烈的诉求。因此,用分库方案就很好地解决了海量业务的问题。
此外,光大银行在新一代财富管理平台中使用了NewSQL数据库,也就是 TiDB。这个系统是理财业务的全流程管理平台,业务量相对缴费要小很多,但业务要更复杂,而且在联机和批量方面都有计算需求。
6.招商银行
作为国内领先的零售银行,招商银行是我国银行业中最先提出手机银行概念的商业银行。招商银行在巩固传统实体营业网点业务优势的同时,快速发展移动支付、互联网金融等新兴业务,迎来了终端用户数量的快速增长。截至2021年底,招商银行App累计用户数1.7亿户,日活跃用户数峰值为1754万户;月活跃用户数6542万户,在全国性股份制银行中排在首位。随着手机银行业务的飞速发展,招商银行的信息化建设也出现了新的挑战。原有烟囱式IT存储架构与数据处理平台在面对达到亿级活跃用户的海量并发时,数据存储系统面临着资源弹性不足、性能扩展能力有限等严峻挑战。
在此趋势下,2017年12月,招商银行与华为成立了分布式数据库联合创新实验室,招商银行团队负责需求和解决方案设计,华为OLTP数据库团队负责技术实现,利用华为在数据库领域的经验进行自主创新,基于鲲鹏架构(ARM架构)进行基础设施建设,助力实现招商银行成为“金融科技银行”的目标。
基于业务需求,招商银行与华为携手打造金融级别分布式数据库GaussDB OLTP,通过改善传统分库分表的做法,让业务开发更加高效。GaussDB OLTP的三大应用场景包括:大容量、高并发类互联网业务;敏捷开发快速交付的金融科技类业务;以及主机下移的银行核心业务。
从2018年4月开始,GaussDB OLTP已经陆续在招商银行包括综合支付交易、信用卡营销、金融科技类项目等多套业务中上线投产。招商银行按照两地三中心(深圳同城双活数据中心+上海灾备数据中心)的方式部署了GaussDB OLTP。2019年在华为的GaussDB产品发布会上,GaussDB OLTP 的两个产品正式发布,即云数据库GaussDB(for MySQL)以及开源数据库 OpenGauss。
在OLAP业务上,招商银行采用了华为GaussDB(DWS),搭建了全球首个基于华为云的超大规模金融级数据仓库。到2021年7月,已经完成全行所有零售数据应用上线。
7.民生银行
民生银行围绕“可控”目标,推动数据库转型,而构建可控数据库首先要从数据库的选型入手。鉴于部分数据库产品存在技术不透明、部署不便利、维护不便捷,以及隐藏诸多安全风险等问题,因此安全性高、可控性强的数据库成了首选。与此同时,产品的成熟度、性能、周边生态,以及厂商研发和技术支持能力也需要进行考量,确保其能够满足企业未来发展的需求。其次是选择开源数据库产品。民生银行在启动数字化转型之初,就已制定了开源策略,即全面拥抱涵盖所有基础软件领域的开源技术,构建开源软件与商业软件并行的架构。在实际措施方面,通过成立独立的开源支持项目组,确保自身具备解决运维问题的能力;与开源软件的社区保持积极互动,并与国内资深服务厂商进行深度合作,让民生银行主动融入到开源生态中,为推动企业发展和建立生态循环贡献自身力量。最后数据库可控还体现在硬件方面。综合对比,国内的处理器和操作系统受技术、政策和企业的支撑,更能满足民生银行的可控数据库建设需求。由此可见,“国内的数据库+开源+软硬件”是构建可控数据库的基础条件,也是民生银行选择数据库产品的标准。
此外,民生银行还建立了八大维度的数据库选型评测体系,从基础功能、性能、高可用性、可维护性、可运维性、用户案例、产品生态和发展趋势入手,利用转账、分布式事务、SQL语法兼容性、高并发小交易性能、热点数据性能等十余个场景进行测试,来对十余种开源数据库进行筛选评估。最终,基于严格的选型策略及评测体系,最终民生银行选择了华为的openGauss数据库来构建可控数据库。
目前民生银行已经建成openGauss的生产运维体系,并实现办公类系统的上线应用。与此同时,由于在TP场景下的稳定性高、生态良好,民生银行并未放弃MySQL数据库,而是形成了openGauss为辅,MySQL为主的分布式架构体系,进而打造出面向高并发、海量数据的OLTP应用,支持水平扩展和开发运维一体化的高可用、高可靠分布式技术平台。
除了在企业内部使用openGauss数据库,并向社区提供Bug和代码之外,民生银行还与第三方服务商进行合作,将日常应用过程中遇到的问题和需求进行共享,在提升第三方厂商的运维和问题解决能力的同时,为建立更加完善的openGauss生态改善提供助力。
民生银行的数据库转型可控之路,不仅为企业未来发展铺平了道路,也为金融行业数字化转型与智能升级探明了方向。
8.北京银行
作为目前我国最大的城市商业银行,由于快速发展的业务需求,北京银行在业务转型中对系统架构进行了升级,逐渐向分布式架构进行转移。早在2016年,该行就开始了对分布式数据库的探索,并于2018年正式投产上线了国产NewSQL分布式数据库TiDB,当时在业内尚没有一个较为完善与成熟的体系,该行根据银行的安全合规需求建设了两地三中心的部署方案。
近年来,随着数字化转型的深入推进,银行积累了大量的结构化数据,以及越来越多的半结构化、无结构化数据。面对不同的数据结构,NewSQL数据库具有高可靠性,可以简单地实现水平弹性拓展,高度兼容MySQL语法,支持HTAP解决方案。
北京银行选择的NewSQL解决方案依托其原生分布式能力,相较于分库分表解决方案所存在的局限性,更适用于金融服务,主要体现在几方面的技术优势:一是业务系统与数据库耦合度较低,业务系统无需预先设定分片规则,数据库对应用开发者更加透明;二是具备在线横向扩展能力,依托Raft一致性算法实现数据的自动重分布,数据库扩缩容时无需人工进行数据迁移操作,保证业务服务“0”中断;三是实现了计算与存储的分离,将SQL运算下推至数据存储层,在复杂的跨分区连接数据计算过程中,SQL运行效率更高;四是无需维护中间件和多套数据库的高可用,极大地降低了运维成本。
随着金融科技的不断发展,针对IT基础设施的自主创新进程也在不断推进。越来越多的银行和数据库企业,开始研究如何采用基于分布式架构的国产数据库,替换集中式架构的国外数据库。未来,基于国家对金融行业软件自主可控提出的明确要求,以及我国数据库产品和解决方案的日益丰富和成熟,将会有更多的银行加入国产分布式数据库的应用实践,加快推进数据库这一关键性金融基础设施的自主创新建设,驱动金融行业的快速、高质量发展。
注:本文于2022年7月5日刊发于微信公众号“BanTech智库”
(特别提示:本文著作权属于BanTech智库所有,转载、摘编或利用其他方式使用本文观点或文字、图片的,应申请白名单、注明来源。违反该声明者,将追究其相关法律责任。)
参考文献:
【1】国内分布式数据库市场规模及行业发展前景分析[OL]. https://www.sohu.com/a/540644072_372052,2022-04-24.
【2】为什么要讲银行的分布式数据库选型呢?[OL]. https://www.modb.pro/db/42220,2020-12-14.
【3】盘点各大银行数据库选型案例!分布式数据库为何如此受宠?[OL].https://baijiahao.baidu.com/s?id=1690848480548316640&wfr=spider&for=pc,2021-02-05.
【4】从金融同行的成功实践,看分布式数据库如何平稳落地[OL]. ttps://baijiahao.baidu.com/s?id=1721563542561859959&wfr=spider&for=pc,2022-01-10.
前期精彩原创推荐(点击图片进入阅读):



这是科技创新最好的时代,这是属于我们每个人最好的时代,关注“BanTech智库”,专注银行科技发展,探索无界金融生态!