![image.png](https://dev-media.amazoncloud.cn/752d96071ca044c4a7a38a2806ea4d92_image.png "image.png")
大家好,我是张晋涛。
前段时间看到了很多关于数据库要不要部署在 Kubernetes 之上的讨论,这些年,这种讨论时有发生。
这个事情并没有绝对的定论,因为每个人都是基于自己的认知,或基于自己过往的经验在进行分析、讨论,每个人的出发点不同,自然得到的结论也是不一样的。
2021 年的时候,我曾经做过一次线上分享: Redis 容器化技术选型,K8S 并非唯一 | MoeLove 在那次分享中,我主要是聊了一些容器化的技术手段,Redis 自身的一些特性,以及基于不同业务场景或者需求时,可以选用的技术方案。
今天这篇,我想再聊聊 Redis 在 Serverless 场景下的应用。
## Redis 的特性及应用场景
[Redis](https://link.segmentfault.com/?enc=PAc7ryyLKvj17fIkI6NvZA%3D%3D.LGM%2Fri0ouFARQiZRv2yC7FUTA%2Fe33%2BMp8HFDlTmXGig%3D?trk=cndc-detail) 是一个开源的,基于内存的数据存储引擎。它非常简洁,但功能全面实用、灵活多变,常被称之为数据库领域的 “瑞士军刀”,被数百万开发者用作数据库、缓存、流引擎和消息代理。
![image.png](https://dev-media.amazoncloud.cn/32c9a490e6514b559c2e8172df6094b6_image.png "image.png")
### Redis 的主要特点
* 速度快:由于它是一个内存型数据库,数据的读取写入都直接通过内存完成,避免了读写硬盘而可能造成的延迟问题。即使在高频的读写场景下也可以有非常不错的表现;
* 适用场景丰富:Redis 有着丰富的数据类型,可以灵活的用于各类场景中(下文将详细介绍);
* 上手成本低:Redis 的操作指令和使用是非常简单的,包括它的通信协议 RESP 也设计的非常简洁,感兴趣的小伙伴可以参考我之前的文章 [理解 Redis 的 RESP 协议 | MoeLove](https://link.segmentfault.com/?enc=QYIi5P8wgMHv2jZeESxwkw%3D%3D.MDlbVZIQachjkEaaWejtpy4CTxXuGrZkR%2F2aS3eCvhtCHTT8xvjNCnL6h9FwNvlO?trk=cndc-detail);
* 支持持久化:尽管 Redis 是内存型数据库,但是考虑到实际的应用场景,如果能对数据进行持久化,那么在遇到故障或者数据恢复时则会方便很多。Redis 支持通过 RDB(内存数据快照) 和 AOF (记录 Server 端的命令到文件)的方式进行持久化;
* 生态丰富:Redis 有着 50+ 种语言的 Client library,覆盖了所有的主流编程语言。同时也有很多 CLI 和 GUI 的客户端工具可以使用;
### Redis 支持的数据类型及适用场景
前面提到 Redis 有着非常丰富的数据类型,每种数据类型都有特定的应用场景。
1. 字符串(string):字符串是 Redis 最基本的数据类型,字符串类型支持的常用命令包括 SET、GET 等;
2. 散列(hash):散列表是一种 K-V 型的数据结构,散列类型可以存储多个键值对,并且支持嵌套数据结构。散列类型支持的常用命令包括 HSET、HGET 等;
3. 列表(list):列表在每个节点存储了一个字符串,可以在列表的两端进行元素的添加或删除操作。列表类型支持的常用命令包括 LPUSH、RPUSH、LPOP 和 RPOP 等;
4. 集合(set):集合是一个不允许有重复元素的无序数据结构,支持取交集、并集和差集等常用操作。集合类型支持的常用命令包括 SADD、SMEMBERS 等;
5. 有序集合(zset):有序集合是一个可以排序的集合,每个元素都有一个 score,支持根据 score 进行排序和范围查找。有序集合类型支持的常用命令包括 ZADD、ZRANGE、ZREVRANK 和 ZSCORE 等;
6. 位图(bitmap):位图不是个实际的数据类型,是一个由二进制位组成的数组结构,支持位运算操作。位图常用于统计、记录用户的在线状态等场景;
7. 位域(bitfield):位域也是一种用于操作二进制位的数据结构和命令集合。允许用户以比特位为单位对字符串进行操作,并且支持多种位操作,例如获取、设置、计数等。位域也可以用于存储和操作布尔值、整数等数据类型;
8. HyperLogLog:HyperLogLog 是一种基数算法,用于估算一个集合的基数。它采用的是随机化算法,并且空间复杂度很低。 HyperLogLog 可用于处理大量数据集的场景,例如网站的 UV 统计;
Redis 支持这么多的数据类型和用法,使得它常年稳居 K-V 型存储排行榜的榜首。以下是我新截图的排名:
![image.png](https://dev-media.amazoncloud.cn/819c8bfcafbc48ddb4b63fe0daebec63_image.png "image.png")
### Redis 集群的架构
Redis 除了支持 master-replica 这种简单的主从模式外,也提供了 Cluster 模式。
**Redis Cluster 是 Redis 数据库的分布式解决方案。它可以将数据分布在多台服务器上,从而提高 Redis 的可用性和性能。**
Redis Cluster 采用了分片的方式来存储数据,将数据分散在多个节点上。每个节点都存储一部分数据,并且每个节点都知道其他节点的信息。这样,当一个节点宕机时,其他节点可以接管它的数据,保证 Redis 集群的可用性。
同时,由于 Redis Cluster 的这种特性,也使得它可以通过增加节点的方式来对集群的容量进行扩展,这解决了单实例或者主从模式下,Redis 受限于所在机器内存容量限制的不足。
并且每个节点仍然可以采用主从的模式,提高其整体的可用性。
![image.png](https://dev-media.amazoncloud.cn/f9a316fec39f494681d1ae334516cbe5_image.png "image.png")
## Serverless 化的 Redis 有何优势
前面简单的介绍了下 Redis 的主要特性和它的集群模式。我们会发现 Redis Cluster 有一个天然的优势 -- 它可以进行水平扩展,从而提升集群的整体容量。
在 Redis Cluster 出现之前,我们的大多数生产环境都是在使用 master-replica 这种主从模式。使用主从模式时候存在一些痛点,关于故障转移之类的我这篇文章中就不谈了,我主要谈下关于容量的部分。
在每次业务申请新上 Redis 主从集群的时候,第一件事情就是需要描述清楚业务场景,用途,以及预期的容量(或者预估的增长速度)。这样才能去找到合适的机器进行集群的部署。
在后续使用过程中,正常情况下会为数据设置 TTL 进行过期,但随着业务的发展,仍可能会导致集群容量逐步增加,当它快要达到容量的 80% 时候,就必须要扩容了。如果机器上尚有空余的内存,那么只需要修改 maxmemory 配置即可,但如果机器上内存容量不足,那只能进行集群的迁移了。到迁移时,同样涉及到了容量的规划,机器的采购等一系列繁琐的事情,苦不堪言。
那如果我们采用 Serverless 化的 Redis 能带来哪些优势呢?
### 无需选择实例大小
无论是使用物理机也好,或者在选择云厂商提供的数据库 / Redis 实例也罢,通常情况下都需要对容量有一个大致的评估,以及增速的评估,然后从一大堆的实例类型的列表中进行选择。
**不同的实例类型则对应不同的内存容量,网络吞吐等,这需要耗费很多的时间,而且为了能在保障业务不受影响的同时优化成本,还需要专门对于不同类型的实例进行压测,看看是否能满足预期,最终才能确认选择哪个实例。**
另外,业务的增长有时候会存在不确定性,一旦业务出现爆发式增长,有些平台不提供扩容能力,就只能迁移了。另一种情况是,一些平台只允许进行规格升级,不允许降级,这样在业务低峰期的时候,也就造成了浪费。
![image.png](https://dev-media.amazoncloud.cn/79abf2999b9946a28478d8257ee01cca_image.png "image.png")
使用 Serverless Redis 就无需花时间去进行这种实例的选择了,它可以根据业务的实际情况,进行动态的水平、垂直伸缩,这就方便很多了。创建时候也只需要指定最基本的信息就足够了。
![image.png](https://dev-media.amazoncloud.cn/4c4dd466f7fc4cc28ec38f8e136d4183_image.png "image.png")
### 计费灵活
传统的固定实例类型的计费方式,通常都是直接按照选定的实例大小进行计费的。这种模式下,即使用量很少,也需要为尚未使用的资源进行付费。
但是在 Serverless 模式下,则只需要按用量进行付费即可。
下图是亚马逊云科技 [Amazon ElastiCache](https://aws.amazon.com/cn/elasticache/?trk=cndc-detail) For Redis (Serverless 版)的计费模式,主要按照两个维度:
* 数据存储:按照数据存储的时间(GB - 小时)进行计费,最小单位是 1 GB;
* ECPUs:指的是 ElastiCache 处理消耗的计算单元,如果在空闲时间是这部分是不产生费用的;
![image.png](https://dev-media.amazoncloud.cn/44f90578208d46008b3c03073b079550_image.png "image.png")
### 弹性伸缩和高可用
在 Serverless 模式下,一旦发现某个实例的负载较高,或者健康状态异常,则可以立刻进行扩容,保证整体的可用性。而且也无需担心容量限制的问题。
同样的,如果负载较低,则可以进行缩容,来节约成本。
![image.png](https://dev-media.amazoncloud.cn/e9ba9ea4014741feb521ca9900da03ca_image.png "image.png")
## Amazon ElastiCache for Redis (Serverless)
最近在亚马逊云科技 Amazon re:Invent 大会上新推出一款 [Amazon ElastiCache for Redis (Serverless 版) 服务](https://link.segmentfault.com/?enc=IuEAIvsOv8yilxi9b5f%2B%2FA%3D%3D.vC%2BYKcWe%2FqXji%2Fpv7wIHqPP99xNU3n7gj6MrfmaB%2F01kl74SYjvCXegsmSeJSqJs?trk=cndc-detail),恰好就是我这篇文章中的实践。
我看到这个服务发布后,赶快进行了一些尝试,以下是我个人觉得的一些重点。
### TLS 连接
在亚马逊云科技亚马逊云科技上创建这个服务的时候,会有一些选项,其中我注意到有个 **Encryption in transit** 这个是默认开启的,并且在创建后也是不允许修改的。
这个特性表明在传输时需要使用 TLS 连接,来保证安全。在我们编译安装 redis-cli 工具的时候,就需要使用 `make BUILD_TLS=yes` 了,这样编译安装后,redis-cli 就可以使用 `--tls` 参数进行连接了,否则会出现连接失败的情况。
替代的方式可以使用 `openssl s_client -connect IP:Port` 这样进行连接。
![image.png](https://dev-media.amazoncloud.cn/7362bd1b104c424cb362f460dc2db919_image.png "image.png")
### 用户权限
在 Security groups 这里,默认是不开启用户认证的。可以在这里修改,创建新的 Security group,并创建用户,这样就可以开启用户认证了。
![image.png](https://dev-media.amazoncloud.cn/46d0b49626bb48b98f90b37d165931c8_image.png "image.png")
### 网络
默认创建后的 endpoint 是一个 VPC 的内网地址,如果需要在外部访问则需要创建 NAT Gateway,或者用其他方式进行转发。
我在相同 VPC 下开了另一个 [EC2](https://aws.amazon.com/cn/ec2/?trk=cndc-detail) 实例跑了下 benchmark,效果如下:
![image.png](https://dev-media.amazoncloud.cn/47c7ad52f95840a5a3c2d505b3ec89b3_image.png "image.png")
控制台上也有相关指标可以看到完整的 benchmark 后的资源消耗情况:
![image.png](https://dev-media.amazoncloud.cn/8a74943c06694a529faa5aebd1b9140a_image.png "image.png")
## 总结
由于 Redis Cluster 架构的灵活性,如果是将它用作 cache,使用 Serverless 的模式能带来不少的优势,提升整体服务的可用性,并且还可以减少最初容量规划上的耗时。
我觉得这将会是一种趋势。
> 本文参与了[「构」向云端 | 亚马逊云科技 x 思否 2023 re:Invent 构建者征文大赛](https://segmentfault.com/a/1190000044413526?trk=cndc-detail),欢迎正在阅读的你也加入。
授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre,知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道