「构」向云端征文大赛｜当 Redis 遇上 Serverless

Serverless

re:Invent

生成式人工智能

### 「构」向云端，构建者征文大赛# re:Invent 2023 带来的全新技术风向标。在本次大会期间，我们广下英雄帖，举行了「**构」向云端，构建者征文大赛**，邀请构建者们一同提笔畅想生成式 AI 与云碰撞的无限可能。本次赛事征集到了众多优秀分享，今天和大家一起分享其中一篇精选作品，让我们一起「构」向云端，感受技术的魅力！ *作者：张晋涛* ![image.png](https://dev-media.amazoncloud.cn/58bab4f7450e41f1bb82f3f07ffadbbd_image.png "image.png") 大家好，我是张晋涛。前段时间看到了很多关于“数据库要不要部署在 Kubernetes 之上”的讨论。这些年，这种讨论时有发生。这个事情并没有绝对的定论，因为每个人都是基于自己的认知，或基于自己过往的经验在进行分析、讨论，每个人的出发点不同，自然得到的结论也是不一样的。 2021 年的时候，我曾经做过一次线上分享《Redis 容器化技术选型，K8S 并非唯一 | MoeLove》。在那次分享中，我主要是聊了一些容器化的技术手段，Redis 自身的一些特性，以及基于不同业务场景或者需求时，可以选用的技术方案。今天这篇，我想再聊聊 Redis 在 Serverless 场景下的应用。 ### Redis 的特性及应用场景 Redis 是一个开源的，基于内存的数据存储引擎。它非常简洁，但功能全面实用、灵活多变，常被称之为数据库领域的 “瑞士军刀”，被数百万开发者用作数据库、缓存、流引擎和消息代理。 ![image.png](https://dev-media.amazoncloud.cn/30ff9709fddd464b94270c2a4bb09095_image.png "image.png") #### Redis 的主要特点 - 速度快：由于它是一个内存型数据库，数据的读取写入都直接通过内存完成，避免了读写硬盘而可能造成的延迟问题。即使在高频的读写场景下也可以有非常不错的表现； - 适用场景丰富：Redis 有着丰富的数据类型，可以灵活的用于各类场景中（下文将详细介绍）； - 上手成本低：Redis 的操作指令和使用是非常简单的，包括它的通信协议 RESP 也设计的非常简洁； - 支持持久化：尽管 Redis 是内存型数据库，但是考虑到实际的应用场景，如果能对数据进行持久化，那么在遇到故障或者数据恢复时则会方便很多。Redis 支持通过 RDB（内存数据快照）和 AOF （记录 Server 端的命令到文件）的方式进行持久化； - 生态丰富：Redis 有着 50+ 种语言的 Client library，覆盖了所有的主流编程语言。同时也有很多 CLI 和 GUI 的客户端工具可以使用； #### Redis 支持的数据类型及适用场景前面提到 Redis 有着非常丰富的数据类型，每种数据类型都有特定的应用场景。 1. 字符串（string）：字符串是 Redis 最基本的数据类型，字符串类型支持的常用命令包括 SET、GET 等； 2. 散列（hash）：散列表是一种 K-V 型的数据结构，散列类型可以存储多个键值对，并且支持嵌套数据结构。散列类型支持的常用命令包括 HSET、HGET 等； 3. 列表（list）：列表在每个节点存储了一个字符串，可以在列表的两端进行元素的添加或删除操作。列表类型支持的常用命令包括 LPUSH、RPUSH、LPOP 和 RPOP 等； 4. 集合（set）：集合是一个不允许有重复元素的无序数据结构，支持取交集、并集和差集等常用操作。集合类型支持的常用命令包括 SADD、SMEMBERS 等； 5. 有序集合（zset）：有序集合是一个可以排序的集合，每个元素都有一个 score，支持根据 score 进行排序和范围查找。有序集合类型支持的常用命令包括 ZADD、ZRANGE、ZREVRANK 和 ZSCORE 等； 6. 位图（bitmap）：位图不是个实际的数据类型，是一个由二进制位组成的数组结构，支持位运算操作。位图常用于统计、记录用户的在线状态等场景； 7. 位域（bitfield）：位域也是一种用于操作二进制位的数据结构和命令集合。允许用户以比特位为单位对字符串进行操作，并且支持多种位操作，例如获取、设置、计数等。位域也可以用于存储和操作布尔值、整数等数据类型； 8. HyperLogLog：HyperLogLog 是一种基数算法，用于估算一个集合的基数。它采用的是随机化算法，并且空间复杂度很低。HyperLogLog 可用于处理大量数据集的场景，例如网站的 UV 统计； Redis 支持这么多的数据类型和用法，使得它常年稳居 K-V 型存储排行榜的榜首。以下是我新截图的排名： ![image.png](https://dev-media.amazoncloud.cn/d71d8a67dfb5405a98448f712f3f7c27_image.png "image.png") #### Redis 集群的架构 Redis 除了支持 master-replica 这种简单的主从模式外，也提供了 Cluster 模式。 **Redis Cluster 是 Redis 数据库的分布式解决方案。它可以将数据分布在多台服务器上，从而提高 Redis 的可用性和性能。** Redis Cluster 采用了分片的方式来存储数据，将数据分散在多个节点上。每个节点都存储一部分数据，并且每个节点都知道其他节点的信息。这样，当一个节点宕机时，其他节点可以接管它的数据，保证 Redis 集群的可用性。同时，由于 Redis Cluster 的这种特性，也使得它可以通过增加节点的方式来对集群的容量进行扩展，这解决了单实例或者主从模式下，Redis 受限于所在机器内存容量限制的不足。并且每个节点仍然可以采用主从的模式，提高其整体的可用性。 ![image.png](https://dev-media.amazoncloud.cn/3d80f9e27b444f9d8443e9fcaeb9fdb4_image.png "image.png") ### Serverless 化的 Redis 有何优势前面简单的介绍了下 Redis 的主要特性和它的集群模式。我们会发现 Redis Cluster 有一个天然的优势—— 它可以进行水平扩展，从而提升集群的整体容量。在 Redis Cluster 出现之前，我们的大多数生产环境都是在使用 master-replica 这种主从模式。使用主从模式时候存在一些痛点，关于故障转移之类的我这篇文章中就不谈了，我主要谈下关于容量的部分。在每次业务申请新上 Redis 主从集群的时候，第一件事情就是需要描述清楚业务场景、用途，以及预期的容量（或者预估的增长速度）。这样才能去找到合适的机器进行集群的部署。在后续使用过程中，正常情况下会为数据设置 TTL 进行过期，但随着业务的发展，仍可能会导致集群容量逐步增加，当它快要达到容量的 80% 时候，就必须要扩容了。如果机器上尚有空余的内存，那么只需要修改 maxmemory 配置即可，但如果机器上内存容量不足，那只能进行集群的迁移了。到迁移时，同样涉及到了容量的规划，机器的采购等一系列繁琐的事情，苦不堪言。那如果我们采用 Serverless 化的 Redis 能带来哪些优势呢？ #### 无需选择实例大小无论是使用物理机也好，或者在选择云厂商提供的数据库 / Redis 实例也罢，通常情况下都需要对容量有一个大致的评估，以及增速的评估，然后从一大堆的实例类型的列表中进行选择。 **不同的实例类型则对应不同的内存容量、网络吞吐等，这需要耗费很多的时间，而且为了能在保障业务不受影响的同时优化成本，还需要专门对于不同类型的实例进行压测，看看是否能满足预期，最终才能确认选择哪个实例。** 另外，业务的增长有时候会存在不确定性，一旦业务出现爆发式增长，有些平台不提供扩容能力，就只能迁移了。另一种情况是，一些平台只允许进行规格升级，不允许降级，这样在业务低峰期的时候，也就造成了浪费。 ![image.png](https://dev-media.amazoncloud.cn/5887bc716c4140eb913ac3a1b4728d99_image.png "image.png") 使用 Serverless Redis 就无需花时间去进行这种实例的选择了，它可以根据业务的实际情况，进行动态的水平、垂直伸缩，这就方便很多了。创建时候也只需要指定最基本的信息就足够了。 ![image.png](https://dev-media.amazoncloud.cn/4d580528495b459dbbee7239d72bb1dd_image.png "image.png") #### 弹性伸缩和高可用在 Serverless 模式下，一旦发现某个实例的负载较高，或者健康状态异常，则可以立刻进行扩容，保证整体的可用性。而且也无需担心容量限制的问题。同样的，如果负载较低，则可以进行缩容，来节约成本。 ![image.png](https://dev-media.amazoncloud.cn/9e6dfc48c4cb4bdf97945f1eabaa10e9_image.png "image.png") ### Amazon ElastiCache for Redis (Serverless) 最近在亚马逊云科技 re:Invent 2023 上新推出一款 [Amazon ElastiCache for Redis（Serverless 版）服务](https://aws.amazon.com/cn/elasticache/?trk=cndc-detail)，恰好就是我这篇文章中的实践。我看到这个服务发布后，赶快进行了一些尝试，以下是我个人觉得的一些重点。 #### TLS 连接在亚马逊云科技上创建这个服务的时候，会有一些选项，其中我注意到有个 **Encryption in transit** 这个是默认开启的，并且在创建后也是不允许修改的。这个特性表明在传输时需要使用 TLS 连接，来保证安全。在我们编译安装 redis-cli 工具的时候，就需要使用 `make BUILD_TLS=yes` 了，这样编译安装后，redis-cli 就可以使用 --tls 参数进行连接了，否则会出现连接失败的情况。替代的方式可以使用 `openssl s_client -connect IP:Port` 这样进行连接。 ![image.png](https://dev-media.amazoncloud.cn/2750daf0b233454d949668641f20b394_image.png "image.png") #### 用户权限在 Security groups 这里，默认是不开启用户认证的。可以在这里修改，创建新的 Security group，并创建用户，这样就可以开启用户认证了。 ![image.png](https://dev-media.amazoncloud.cn/a9e88cf47ac04f1fb323533f1dec76e8_image.png "image.png") #### 网络默认创建后的 endpoint 是一个 VPC 的内网地址，如果需要在外部访问则需要创建 NAT Gateway，或者用其他方式进行转发。我在相同 VPC 下开了另一个 EC2 实例跑了下 benchmark，效果如下： ![image.png](https://dev-media.amazoncloud.cn/9238ec9a32324e4ca5763377e1bab9f5_image.png "image.png") 控制台上也有相关指标可以看到完整的 benchmark 后的资源消耗情况： ![image.png](https://dev-media.amazoncloud.cn/d45b670542d14c95a81ecdc8e846da76_image.png "image.png") ### 总结由于 Redis Cluster 架构的灵活性，如果是将它用作 cache，使用 Serverless 的模式能带来不少的优势，提升整体服务的可用性，并且还可以减少最初容量规划上的耗时。我觉得这将会是一种趋势。（本文经过后期编辑整理后发布） ### #欢迎观看更多精彩作品# 「构」向云端，构建者征文大赛现已评奖，欢迎大家扫描二维码或点击阅读原文，阅读更多精彩内容！ ![image.png](https://dev-media.amazoncloud.cn/9a32ec8c28de4aaba8421af5dac0f86d_image.png "image.png") ![开发者尾巴.gif](https://dev-media.amazoncloud.cn/767bd96672224f4d809d77bd42760344_%E5%BC%80%E5%8F%91%E8%80%85%E5%B0%BE%E5%B7%B4.gif "开发者尾巴.gif")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家