多形态技术布局,满足客户的“极致追求” 「蚂蚁集团」OceanBase吴东昕:原生分布式数据库带来数据管理革命

2021-02-18 11:25:07来源:亚太CDN产业联盟 热度:
为期两天的Distributed Cloud|2020全球分布式云大会,为5G商用时代的到来,在新一轮云计算技术变革的关口,呈现出分布式云生态全景,影响2021年分布式云战略科技趋势,共享新商业引擎,共寻亿万级苍穹,开创未来新篇。
 
 
在12月17日上午的“分布式云论坛”上,蚂蚁集团 OceanBase解决方案部资深总监吴东昕带来题为《原生分布式数据库带来数据管理革命》的精彩演讲。
 
01 随时代步伐 积累经验 厚积薄发
 
随着数字化转型,云计算、边缘计算,各种各样的互联网业务的兴起,大量的业务都需要使用数据库,这便对数据库的处理能力成为巨大的挑战。传统IOE架构数据库依赖高端硬件,系统难于扩展,价格昂贵。虽然,基于中间件的分库分表方案解决了扩展性的问题,但是跨库事务、全局一致性、负载均衡、复杂SQL仍然成为亟待解决的问题。
 
而分布式数据库的出现,解决了数据库处理能力横向线性扩展问题。分布式数据库基于普通服务器,降低系统成本低,并支持原生分布式查询。对应用提供透明的支持分布式事务,确保全局一致性,具有灵活的部署方式和负载均衡能力。
 
在分布式数据库迅速发展的趋势下,蚂蚁集团加快发展步伐。自2010年,淘宝产品立项第一个用户起,到2019年创造了TPC-C的6100万的记录。今年6月,OceanBase正式成立独立子公司北京奥星贝斯科技有限公司,进行独立商业化运作。吴东昕表示:“蚂蚁希望把分布式数据库云的能力提供给使用数据库的应用,所以这样一款原生分布式数据库应用而生。如今,我们能做到全分布式、多站点的扩展。”
 
对OceanBase来讲,从第一天的内部使用,到支撑双十一大量跟金钱交易的场景,是从逐渐解决扩展能力,解决容灾能力,最终到解决大规模运维效率,便是与其它同类产品的不同之处,首先在内部使用中经历了长时间的打磨,再对外部全面开放使用。
 
02 多形态技术布局 做到市场技术双驱动
 
OceanBase发展到2020年,更加重视市场驱动,针对国内中大型金融机构、国计民生相关的政府与公共事业等有着相关需求的客户,OceanBase能够解决客户对高可用性、强一致性的诉求,同时能够实现对上层应用透明,减少应用的侵入性,还能做到扩展自动分片,在线扩容/缩容等功能。吴东昕表示,“在原生分布式数据库的技术发展方面,我们希望做到云原生,将来我们也会做到存储计算分离。”
 
OceanBase 是一款100%完全自研的数据库软件。吴东昕介绍,从整个存储引擎到透明的分布式多地多中心多活的部署架构到系统引擎全部都是自研的。OceanBase提供了Oracle 兼容和MySQL 兼容两种应用模式,同时通过原生分布式架构,OceanBase横向扩展做到了TPC-C 7.07亿tpmC的世界记录。
 
OceanBase数据库架构有着多副本、对等节点、无需存储设备共享、分区级高可用性、强一致等诸多特点。在实现多副本架构时,所有的节点都对等,协同服务做到全部可读写,也不需要专用的设备和专用存储网络,可以实现多站点多活的方式。吴东昕表示,OceanBase虽然是分布式数据库,用户会发现在使用方式上与传统的单机数据库一模一样,不需要应用做特殊修改和专门的适配,做到了将困难交给数据库处理,把方便留给应用。
 
OceanBase在可用性上,远远超过传统的架构,对于少数副本或者ZONE发生故障,写事务达到超过半数副本成功时就能成功不影响业务,若主副本异常,则剩余多数的从副本依据Paxos协议协商出新的主副本。吴东昕表示,“通过多地多活的模式,无论是发生一个机房的故障,还是多站点的故障,只要超过半数副本存活,就能够确保零数据的丢失。即便整个机房宕机,光纤和网络的中断也可以在30秒实现RPO=0。”
 
在这上面我们提供了非常丰富的多活的解决方案,包括如果只有一个机房,我们提供的是一个机房高可用,到两地三中心传统的部署架构,到异地多活,包括其他的客户不能提供多个机房,我们同样也提供同城双机房的主备库架构,提供各种各样的容灾和业务连续性保护。
 
OceanBase有几种典型的部署方式,例如在一个城市部署3个机房,OceanBase能做到跨机房,在同城多个核心机房延迟一般在0.5 ~ 2ms之间完全透明的负载均衡和容灾保护。而两地三中心部署,正常情况下和同城三中心部署的延迟一致。两地三中心五副本部署,能在单ZONE故障情况下不影响业务响应延迟。而OceanBase将三地五中心分布式多活架构作为对“数据不丢失,业务不停机”的极致追求。“在今年增加了主备库的方案,为客户在相对低成本的方式下提供可用的容灾解决方案。”吴东昕说。

为期两天的Distributed Cloud|2020全球分布式云大会,为5G商用时代的到来,在新一轮云计算技术变革的关口,呈现出分布式云生态全景,影响2021年分布式云战略科技趋势,共享新商业引擎,共寻亿万级苍穹,开创未来新篇。
 
在12月17日上午的“分布式云论坛”上,蚂蚁集团 OceanBase解决方案部资深总监吴东昕带来题为《原生分布式数据库带来数据管理革命》的精彩演讲。
 
01
随时代步伐 积累经验 厚积薄发
随着数字化转型,云计算、边缘计算,各种各样的互联网业务的兴起,大量的业务都需要使用数据库,这便对数据库的处理能力成为巨大的挑战。传统IOE架构数据库依赖高端硬件,系统难于扩展,价格昂贵。虽然,基于中间件的分库分表方案解决了扩展性的问题,但是跨库事务、全局一致性、负载均衡、复杂SQL仍然成为亟待解决的问题。
 
而分布式数据库的出现,解决了数据库处理能力横向线性扩展问题。分布式数据库基于普通服务器,降低系统成本低,并支持原生分布式查询。对应用提供透明的支持分布式事务,确保全局一致性,具有灵活的部署方式和负载均衡能力。
 
在分布式数据库迅速发展的趋势下,蚂蚁集团加快发展步伐。自2010年,淘宝产品立项第一个用户起,到2019年创造了TPC-C的6100万的记录。今年6月,OceanBase正式成立独立子公司北京奥星贝斯科技有限公司,进行独立商业化运作。吴东昕表示:“蚂蚁希望把分布式数据库云的能力提供给使用数据库的应用,所以这样一款原生分布式数据库应用而生。如今,我们能做到全分布式、多站点的扩展。”
 
对OceanBase来讲,从第一天的内部使用,到支撑双十一大量跟金钱交易的场景,是从逐渐解决扩展能力,解决容灾能力,最终到解决大规模运维效率,便是与其它同类产品的不同之处,首先在内部使用中经历了长时间的打磨,再对外部全面开放使用。
 
02
多形态技术布局 做到市场技术双驱动
OceanBase发展到2020年,更加重视市场驱动,针对国内中大型金融机构、国计民生相关的政府与公共事业等有着相关需求的客户,OceanBase能够解决客户对高可用性、强一致性的诉求,同时能够实现对上层应用透明,减少应用的侵入性,还能做到扩展自动分片,在线扩容/缩容等功能。吴东昕表示,“在原生分布式数据库的技术发展方面,我们希望做到云原生,将来我们也会做到存储计算分离。”
 
OceanBase 是一款100%完全自研的数据库软件。吴东昕介绍,从整个存储引擎到透明的分布式多地多中心多活的部署架构到系统引擎全部都是自研的。OceanBase提供了Oracle 兼容和MySQL 兼容两种应用模式,同时通过原生分布式架构,OceanBase横向扩展做到了TPC-C 7.07亿tpmC的世界记录。
 
OceanBase数据库架构有着多副本、对等节点、无需存储设备共享、分区级高可用性、强一致等诸多特点。在实现多副本架构时,所有的节点都对等,协同服务做到全部可读写,也不需要专用的设备和专用存储网络,可以实现多站点多活的方式。吴东昕表示,OceanBase虽然是分布式数据库,用户会发现在使用方式上与传统的单机数据库一模一样,不需要应用做特殊修改和专门的适配,做到了将困难交给数据库处理,把方便留给应用。
 
OceanBase在可用性上,远远超过传统的架构,对于少数副本或者ZONE发生故障,写事务达到超过半数副本成功时就能成功不影响业务,若主副本异常,则剩余多数的从副本依据Paxos协议协商出新的主副本。吴东昕表示,“通过多地多活的模式,无论是发生一个机房的故障,还是多站点的故障,只要超过半数副本存活,就能够确保零数据的丢失。即便整个机房宕机,光纤和网络的中断也可以在30秒实现RPO=0。”
 
在这上面我们提供了非常丰富的多活的解决方案,包括如果只有一个机房,我们提供的是一个机房高可用,到两地三中心传统的部署架构,到异地多活,包括其他的客户不能提供多个机房,我们同样也提供同城双机房的主备库架构,提供各种各样的容灾和业务连续性保护。
 
OceanBase有几种典型的部署方式,例如在一个城市部署3个机房,OceanBase能做到跨机房,在同城多个核心机房延迟一般在0.5 ~ 2ms之间完全透明的负载均衡和容灾保护。而两地三中心部署,正常情况下和同城三中心部署的延迟一致。两地三中心五副本部署,能在单ZONE故障情况下不影响业务响应延迟。而OceanBase将三地五中心分布式多活架构作为对“数据不丢失,业务不停机”的极致追求。“在今年增加了主备库的方案,为客户在相对低成本的方式下提供可用的容灾解决方案。”吴东昕说。

责任编辑:吴昊