【项目经验】Redis Sentinel从工程中下线并对业务迁移-(二)

在上篇文章【项目经验】Redis Sentinel从工程中下线并对业务迁移-进行中-CSDN博客有说到迁移的计划。最近一直按照计划进行迁移，期间遇到了不少问题。总结如下：

一、key未设置过期时间

redis基于内存存储，主要作用是缓存。当大量的key未设置过期时间时，redis内存空间的利用率会降低，执行效率也会受影响。

弊端：

1. 内存占用

最直接的弊端是可能会造成内存使用持续增长。如果没有过期机制自动删除不再需要的数据，随着时间推移，Redis实例可能会消耗越来越多的内存。这最终可能导致内存溢出，影响Redis服务的稳定性和性能。

2. 资源管理困难

不设置过期时间使得手动管理Redis中的数据变得复杂。需要额外的机制或策略来监控和控制数据量，避免不必要的数据累积。

3. 性能下降

随着数据量的增加，查找、读取或写入操作的效率可能会降低，因为更多的内存消耗意味着更频繁的磁盘交换（如果开启了虚拟内存）。此外，大量的无期限数据可能导致缓存命中率下降，从而降低了Redis作为高性能缓存的优势。

4. 影响其他业务

如果Redis用作多个应用或服务的共享缓存，未过期的key可能会挤占其他应用需要缓存的空间，影响整体系统的资源分配和效率。

5. 风险增加

在极端情况下，如服务器硬件故障或重启前，未过期的key会全部写入磁盘（如果配置了持久化），延长了恢复过程，增加了数据丢失的风险。

6. 淘汰策略受限

Redis提供了多种内存淘汰策略（如LRU、LFU等），用于在内存不足时决定哪些数据应该被移除。但当大多数或所有key都没有过期时间时，这些策略的效果会大打折扣，可能无法有效地释放内存给更重要的数据使用。

如何解决？

根据业务的特点设置合理的过期时间，并检查从redis中获取不到时，从表中或接口获取源数据的方案是否仍然可行。

因为之前没有过期时间，业务中的数据大概率一直从redis中获得的，如果表或接口的源数据发生了变更，业务可能并无感知。此时key过期，查询源数据，可能导致业务无法正常执行。

二、big key

目前排查结束未发现big key，但有一些value缓存的是对象信息，而且未设置过期时间，同时业务中只使用了其中某几个属性值。后续我将把这些属性信息查出来单独缓存和超时时间，并停止对缓存对象的使用。

虽然没发现big key，我们也再聊一下big key的识别、弊端和解决方案。

如何找到big key？

1. 使用MEMORY USAGE命令
直接在Redis命令行界面使用MEMORY USAGE key_name命令，可以查看指定Key的内存占用情况。通过遍历并比较各个Key的内存使用量，可以找出占用内存较多的大Key。

2. Redis自带的--bigkeys 选项
虽然实际中--bigkeys并不是一个直接可用的Redis命令，可以使用类似功能的脚本或客户端工具来扫描数据库并统计不同类型中最大的Key。对于字符串类型，此方法能直接反映出value的字节大小；对于集合、列表、有序集合、哈希等复杂类型，则主要统计元素数量，可能需要进一步的分析来确定实际占用的内存大小。

3. 使用Redis客户端工具
利用如redis-cli、Redigo等客户端工具，编写脚本来遍历所有Key，并计算它们的大小进行排序。这样可以系统地识别出占用内存最多的大Key。

4. 手动或自动化脚本扫描
编写脚本使用SCAN命令安全地遍历Redis中的Key空间，结合MEMORY USAGE或其他方法计算每个Key的大小，然后根据大小阈值标记出大Key。这种方法可以灵活定制扫描和评估逻辑。

5. 分析RDB文件
在Redis执行备份生成的RDB文件中，也可以分析Key的大小。虽然这通常不作为实时监控的手段，但在离线分析或计划性维护时，通过解析RDB文件可以获取详细的Key信息。

6. 使用第三方工具
工具如RdbTools、RedisInsight等提供了图形界面和高级分析功能，可以帮助更容易地识别大Key，同时提供数据可视化和优化建议。

选择合适的方法时，应考虑操作的便利性、准确性以及对Redis服务运行时的影响。在生产环境中，特别注意避免因扫描操作引起的服务压力。