关系数据库技术,作为计算机技术的基石,兴起于上世纪的80年代。最初的两个系统是IBM Almaden研究院的System R和加州大学伯克利分校的Ingres。
在商业领域,经过一系列的厮杀,在淘汰掉包括Informix和SyBase这些强劲对手以后,Oracle,IBM和微软最终成为了商业数据库领域的三驾马车。
其中Oracle数据库更是一骑绝尘,在相当长一段时间内,Oracle数据库被广泛应用到了包括银行等在内的各种领域,在商业数据库领域是无敌的代名词。
进入21世纪以后,事情逐渐发生了变化。一方面,以MySQL和PostgreSQL为代表的开源数据库逐渐成熟。另外一方面,伴随互联网和电子商务的发展,Oracle数据库也终于遇到了它也搞不定的场景,比如双十一。所以这个时候,对开源数据库进行再次开发,以解决自身业务需求,成了很多互联网和电子商务公司的选择。
伴随着电子商务公司把自己富余的计算和存储资源和能力释放出来,服务其他企业,我们也迎来了云计算时代。云计算时代,也给整个数据库市场带来了巨大的冲击。
这种冲击体现在两个方面。一方面是云计算的计算和存储分离架构,给数据库提供了新的发展空间。从用户角度来看,不但是存储和计算能力上去了,而且性价比也更高了。另外一方面是用户一旦上云,大概率会同时在其上云的厂商那里采购数据库产品。所以失去了云计算,也很可能会同时失去数据库的订单。
Oracle这两年在数据库领域的市场份额不断的丢失,已经掉出了全球数据库第一的厂商,最大的原因就是不断被云厂商比如亚马逊和微软吞食数据库市场。云计算无疑正常重构数据库市场。
作为中国最大的电商,和最早进入到云计算领域的阿里巴巴来说,显然也不可能缺席这场重要的趋势性的改变。
和亚马逊一样,阿里巴巴在数据库领域有着很多中国企业所不具备的优势。阿里巴巴作为中国最大的电商,其内部场景非常的丰富,在开源数据库系统的二次开发上,阿里巴巴积累了丰厚的经验。而阿里云上线了数据库产品后,又为数百万客户提供服务,更是给了阿里全方位的打磨时间。
经过三年的研发,2017年9月阿里云发布了自主研发的云原生数据库PolarDB,并于2018年4月正式商用。这是一个标志性的事件。
PolarDB一诞生就集众多创新技术于一身。PolarDB采用了自研的分布式存储引擎设计,底层使用了RDMA的高速网络。该分布式存储引擎可以提供比原生MySQL大百倍的存储空间,同时还做到了和本地存储类似的访问速度。
更重要的是,PolarDB不但性能优异,而且性价比很高,在100TB的数据容量上提供了10倍于传统商业数据库的性价比,性能已经达到AWS Aurora的2倍。
在PolarDB的基础上,2020年6月,云原生分布式数据库PolarDB-X正式商用。PolarDB-X采用 Shared-nothing 架构进行设计实现系统的透明水平扩展采用 MVCC + TSO方案及2PC协议实现分布式事务满足ACID特性通过原生MPP能力,支持HTAP混合负载。
2021年10月,PolarDB进一步重磅升级。这次升级在业内首次实现、存储和内存资源的三层解耦。在业内首次内存池化,使得弹性能力大幅度提升,实现了完全按量使用,按需弹性,大大降低了使用成本。
同时,这次升级还带来了领先行业的多主架构,支持32个节点并发写入。这个功能比亚马逊的Aurora还要好,帮助客户实现了秒级横向写扩容缩容能力,既能帮助SaaS/电商用户能够秒级拥有应对类似双十一流量洪峰的能力,又能实现流量低峰的秒级无感缩容,降低成本。
2022年1月,阿里云PolarDB再次商业化了列存索引和并行查询2.0功能。基于共享内存池的列存索引和并行查询2.0功能,使得PolarDB全面升级为云原生HTAP数据库系统,可同时处理OLTPOLAP型混合负载进一步简化运维、节省成本根据测试,PolarDB在大数据量上运行复杂查询的性能可以与Oracle/SQL Server等业界最顶尖的商用数据库系统处在同一水平。
PolarDB的成功,首先是阿里巴巴独特的环境。作为中国和全球最大的电商,需要面对双十一这种罕见的场景,阿里巴巴的业务场景给数据库团队提供了难得的磨练机会。

而阿里坚持不懈的在云计算上的不断投入,使得其成为中国最早也是最强的云计算厂商,是PolarDB成功另外一个重要的原因。
如果说电商场景是内部客户和内部场景的话,云计算则给阿里带来了几百万大大小小的外部客户。内部场景奠定了产品的基础,这些外部客户和它们的使用场景,则给产品提供了各种各样不同的使用场景,包括很多稀奇古怪的可能性。这些场景持续不断打磨锤炼产品。

但是最重要的,还是阿里有一只强大的数据库团队,还是阿里一如既往的对数据库领域的不断投入。产品最终能够胜出,离不开人一步一步搭起来。阿里巴巴有着位于全球各地的,庞大的数据库团队,这是PolarDB能够脱颖而出的关键。
云计算的出现,已经在重构数据库市场了。而阿里云显然非常的清楚,云数据库这个云大厂必争之地的重要意义,所以对于数据库领域,阿里云一直在重兵。

不但自身在重兵投入,阿里云数据库也不断在和外界合作20218阿里云联合中国科学技术大学团队撰写的PolarDB数据库核心架构创新论文被国际数据库顶级会议VLDB 2021录用。这也是国内主流云数据库厂商第一次在VLDB Research Track上发表数据库核心架构方面的创新论文。
除了学术合作以外,阿里云20215月悬数据库开源计划,并率先开源PolarDB for PostgreSQL分布式版。2021年10月PolarDB-X正式开源。通过开源,阿里云数据库进一步聚合开源社区力量大力发展云原生分布式数据库技术。
PolarDB的成功,既是云计算时代重构数据库市场的机遇给的机会,也是阿里巴巴内部和阿里云客户提供的各种场景的锤炼的结果,更是阿里云大力投入数据库领域,阿里云数据库团队的不懈努力的必然。
继续阅读
阅读原文