为什么亚马逊云数据库不讲 HTAP

Amazon Aurora
Amazon Aurora Serverless v2
0
0
![image.png](https://dev-media.amazoncloud.cn/98b101b03b124e6c85a5687eff2ab9ee_image.png "image.png") 在 AWS re:Invent 2023 掌门人 Adam Selipsky 的 Keynote 上,数据库方面最重磅的主题是 Zero-ETL,从 TP 数据库 (RDS, Aurora, DynamoDB) 同步数据到 AP 数据库 (Redshift)。 ![image.png](https://dev-media.amazoncloud.cn/42c6c9ace3b74449a406aa0aa3d19ba4_image.png "image.png") Zero-ETL 是 AWS 在去年 re:invent 2022 上推出的概念,今年则继续增强。这里 AWS 没有选择另一条路线 HTAP (Hybrid Transactional/Analytical Processing)。如果搜索 AWS 官网,反倒是 TiDB 的 HTAP 方案更显眼。 ![image.png](https://dev-media.amazoncloud.cn/008a5f8b38634ab6ad706690a706a3aa_image.png "image.png") 而 TiDB, OceanBase 还是阿里云官网上的 HTAP 内容则要多得多 ![image.png](https://dev-media.amazoncloud.cn/e50dd242fdf643d39e99603eca20730a_image.png "image.png") TiDB 更进一步,还主办了 HTAP Summit ![image.png](https://dev-media.amazoncloud.cn/1bc1f13529d24d9883a87c2a77a64b40_image.png "image.png") # AWS HTAP 的不选择 假设 AWS 要讲 HTAP 故事的话,首先会面临一个问题,到底是在 Aurora 里讲,还是在 Redshift 里讲。我们先来看一下 AWS 里数据库产品相关的组织架构。 ![image.png](https://dev-media.amazoncloud.cn/a409e9db34384776aa1d476273c0c107_image.png "image.png") 大主管是 Swami 博士,统管了数据库,大数据以及AI/[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail) ![image.png](https://dev-media.amazoncloud.cn/6f055afade7b4c39a3fdd6089c488c5b_image.png "image.png") 数据库部门负责人 1,主要负责 Aurora + Redshift ![image.png](https://dev-media.amazoncloud.cn/a50680c362ae470d85b54308922c85ae_image.png "image.png") 数据库部门负责人 2,主要负责 RDS + DynamoDB ![image.png](https://dev-media.amazoncloud.cn/f21c96ba85e34692a5a134a3aa87ebbe_image.png "image.png") 大数据部门负责人 ![image.png](https://dev-media.amazoncloud.cn/ea315debf89543ecbaa017e282ffc3ab_image.png "image.png") AI / [机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)部门负责人 *** Aurora 和 Redshift 两个产品都由同一个 VP 负责。但 Aurora 和 Redshift 都是 AWS 的拳头产品,可能也是 AWS 所有产品线里,综合营收和利润排在前五的两大产品。所以无论把 HTAP 放哪个,可能都会对另一个产生很大负面影响。 另外不仅是对于 Aurora 或者 Redshift 的影响,对于其他数据库产品也会有影响。如果讲了 HTAP,像 RDS, DynamoDB 这两个核心产品,它们同步到数仓的故事该怎么讲呢。 所以,综合下来,AWS 选择推出 zero-ETL 这个概念,打造一个连接器的品牌,这样让所有的数据库产品线都能获益。 # TiDB, OceanBase HTAP 的选择 对于像 TiDB, OceanBase 这样的单一数据库厂商,推出一个 all-in-one 的 HTAP 方案也是比较合理的。毕竟手上就一个数据库产品,把它的能力做大做强。 ![image.png](https://dev-media.amazoncloud.cn/9cc323704f9945de8c12979712d8d88e_image.png "image.png") 像 OceanBase 在前不久发布会上讲的一体化数据库,一个数据库,解决 80% 问题。国外对标这块的有 SingleStore ![image.png](https://dev-media.amazoncloud.cn/f40426e40c2b4a8f9ef4c611de65cce8_image.png "image.png") SingleStore 之前的名字叫 MemSQL,2020 年改名的时候号称是全球第一款云原生 HTAP 数据库。 ![image.png](https://dev-media.amazoncloud.cn/553a927a2acc4096b07df88f15d83a7d_image.png "image.png") 顺便提一嘴,当下很火的数据库 Neon 也是由 SingleStore 的联合创始人/CTO 创立的。 ![image.png](https://dev-media.amazoncloud.cn/ff7f8b07f25e4597bea6b23b653e0bb6_image.png "image.png") # 阿里云 HTAP 的选择 阿里云在许多方面都借鉴了 AWS,但在 HTAP 这个点上,看起来是选择了和 AWS 相反的道路。 对标 AWS Aurora 的 PolarDB 讲 HTAP ![image.png](https://dev-media.amazoncloud.cn/829a61ca6ed8409eb4b1a9db9eda7890_image.png "image.png") 对标 AWS Redshift 的 ADB 也讲 HTAP ![image.png](https://dev-media.amazoncloud.cn/33b4f9ccf3f343ee87185a110b05534a_image.png "image.png") 之前还推出过一个 HybridDB,专门讲 HTAP,现在已经下线了。 ![image.png](https://dev-media.amazoncloud.cn/9a8dcf7b19c84d5289e1c54224c557a8_image.png "image.png") 还有 RDS + ClickHouse 构建一站式 HTAP 的解决方案 ![image.png](https://dev-media.amazoncloud.cn/ddcea3227ef04af5b8735457d400313b_image.png "image.png") # 南橘北枳 ![image.png](https://dev-media.amazoncloud.cn/a19f6f3a12dc4d59886cdea033ea2ef4_image.png "image.png") HTAP (Hybrid Transactional/Analytical Processing) 这个概念,其实国内远比国外要流行。可能这也确实和市场有关,国内大家想要一个大而全的东西,而国外大家更喜欢各自做好一块事情,然后连接起来。就像国内的飞书做成了 all-in-one 的庞然大物,国外 Slack 还是专注于 IM,Email/文档有 Google Workspace,HR 则有 Workday。 而即使是底层的数据库系统也不能免俗吧。
0
目录
关闭