有关Redis的一些思考和理解

电子设计 2020-10-30 1311

描述

本篇文章不是一篇具体的教程，笔者打算记录一下自己对 Redis 的一些思考。说来惭愧，笔者刚接触 Redis 的时候只是简单地使用了一下，背了一些面试题，就在简历上写下了 Redis 这个技能点。

我们能在网络上轻易地找到关于 Redis 具体知识点的讲解，但很少有文字说明为什么会有这项技术，笔者希望通过本文总结一下个人目前对 Redis 的理解。

1. 初识 Redis

最开始的时候，笔者是通过网络上面的一些项目教程了解到 Redis 的，当时教程里说把首页数据放到 Redis 里，能够加快首页数据的访问速度，于笔者我就照做了。代码跑起来后，发现好像确实加载得蛮快的，就当完成了。

项目做完后，写到了简历里，顺便在技能里写上熟练使用 Redis，再背了几道关于 Redis 的数据类型，持久化机制的面试题，便去找实习了。

当时面试的时候面试官问笔者：你为什么使用 Redis 呀？

笔者按照项目教程里说的复述了一遍：因为能让首页更快地加载数据，咱们的产品首页是很重要，越快加载出数据，用户越满意。

现在回想起来真是哭笑不得，你也不能说这个回答有问题，Redis 用作缓存的一大亮点就是能够加快数据查询效率，但是如果从技术面试的角度看，这个回答其实更应该从技术的角度去答，这也是促使笔者写这篇文章的冲动之一。

2. 为什么要有 Redis 这项技术？（你为什么用 Redis）

如果现在再被问到为什么要用 Redis，笔者打算从计算机的存储结构开始聊。

计算机界有一本名书《深入理解计算机系统》，里面有一幅关于计算机存储结构的图，非常经典：

由图可见计算机的存储器是一个金字塔结构，越上层的存储器存储效率越高，越下层的存储效率越低。而计算机中内存的层级位于磁盘之上，内存的存储效率要比磁盘快得多。

正常情况下，我们会把应用的数据存放在数据库中，数据库把数据存放在磁盘;而 Redis 是一款基于内存的存储系统，数据都存在内存里，这就是从 Redis 读取数据比从数据库读取数据要快的根本原因了。

看到这里你可能会说，把数据存在内存有啥了不起的，我可以用谷歌的 guava 呀！再不济，我可以直接 new 一个 HashMap 存数据呀，这不都是基于内存的吗？

这个问题让我联想起了我在网上看面经的时候看到的一道题：如果让你设计一个缓存，你会怎么设计？

大家可以想一下 guava 和 Map 集合使用时的缺点是什么？

很明显一点就是这两者虽然基于内存，但他们使用的是 jvm 的内存，如果 jvm 挂掉或者重启了，数据也就丢失了。这就能方便我们联想到 Redis 的持久化机制，Redis 的持久化机制使得内存中的数据能够持久化到磁盘上，解决内存数据掉电易失的问题，而且 Redis 是一款中间件，无需依赖于 jvm。

（当初我只是死背 Redis 的持久化机制，并没有想过为什么。我想搞清楚了这背后的关系后再去学习，能够学得更扎实一些吧）

再换一个角度：既然数据库是因为磁盘才慢，那为啥不再内存里实现数据库呢？

还别说，SAP 公司还真有基于内存的数据库系统，但是使用内存有一个致命的缺点：那就是贵！能买得起那套软件和巨大内存机器的公司毕竟是少数，所以说为什么要使用 Redis，就是因为他在低效的磁盘和昂贵的内存中取了一个折中。

补充：面试的时候还被问到一个问题：Redis 的内存淘汰机制

当时直接懵圈了，后来想了一下其实这是一个再正常不过的考点了：Redis 把数据存放在内存，内存的空间有限，总会有用完的一天。当内存使用完之后肯定需要有相应的内存淘汰策略来释放内存。

不过说到内存淘汰，我还想起一个高级点的知识点，由于 Redis 的内存是有限的，我们使用内存的时候应该更加小心。Redis 内部是有许多高效使用内存的招数的，比如说我们存放用户信息的时候，把用户信息存成一个 hash，要比把用户信息逐条用 key-value 存储占的空间小得多，这些知识你可以在 Redid 的官网上找到。

3. 关于 Redis 的主从复制，哨兵，集群

在学习 Redis 之前，我对分布式的知识了解得非常少。当时为了面试背 Redis 的面试题，背到有关主从复制，哨兵，集群等知识点的时候，我既兴奋又茫然。感觉自己背完后掌握了许多分布式的知识，但是把这些知识点都揉在一起了，根本不知道这背后的逻辑是什么。现在想通了一些，应该好好记下来：

在扩展到多机之前，我们先想一下单机的 Redis 有什么缺点：

有可能出现单点故障，这样 Redis 服务就不可用了

单一台机器的内存有限，存储不了太多的数据

如果访问量很大的话，单台机器压力会很大

通过第一个缺点，我们可以引出为什么需要主从复制和哨兵。大家想一想，如果我们只有一个 Redis 服务，要是服务挂了就没法用了，但如果我们安排多一台 Redis 服务器，它的数据时刻与第一台 Redis 的数据保持一致，这样当第一台 Redis 挂掉后，我们就可以把请求迁移到第二台 Redis 上，这样 Redis 服务的可用性就提高了。为了让第二台 Redis 的数据与第一台 Redis 保持一致，我们就需要用到主从复制。

有时候，可能一主一从的配置还是不够保险，这个时候我们就要为主节点配置两个或以上的从节点，那么问题来了，要是主节点挂了，该通过什么方案在从节点中选出新的主节点呢？这就用到了哨兵机制。

而且在一主多从的情况下，我们使用主从复制让多台 Redis 的数据保持一致，这个时候我们就可以把读请求分摊到从节点上，这样能有效缓解主节点的读压力。

但如果 Redis 的写请求压力也很大，而且数据量很大，这个时候为 Redis 增加备份机的横向扩展已经帮不上什么忙了，这个时候我们就要考虑纵向扩展，增加多台 Redis 分摊写请求，让不同的 key 落到不同的机器上。这个时候我们就要考虑使用一致性哈希等算法把不同的 key 分给不同的机器。

Redis 自身也提供了集群机制，但内部使用的不是一致性哈希，而是哈希槽。简单来说就是在哈希槽中划分不同的区间，不同的区间对应不同的机制;当扩容或缩减的时候有相应的哈希槽调整策略。

我最初学习 Redis 的多机策略的时候就是搞不清楚集群，主从复制，哨兵机制之间的关系。其实集群就是一套完整的 Redis 多机解决方案，他有效解决了单机 Redis 的所有问题。当你在集群中为某个节点配置从机的时候，主从节点间同步用的就是主从复制。主节点挂掉之后，从节点的选取，内部的逻辑就和哨兵机制相似。当我们使用集群机制的时候，就可以省去自己写类似一致性哈希这样的分摊逻辑，集群机制会给节点加上相应的数据结构来完成这些功能。

如果想深入了解集群背后的实现原理，我推荐这样一个学习路线：

首先登录官网，按照官网的步骤学习配置主从复制，配置哨兵，搭建集群

然后看《Redis 的设计与实现》这本书，阅读主从复制，哨兵和集群这三个章节

4. 后话

笔者觉得，如果把文章中提到的 Redis 的点都深入了解一下，Redis 基本能算入门了。

写下这篇感想主要也是想提醒自己，学一项技术的时候多问为什么，这样知识学到手后不容易忘掉。

至于为什么说只能说是入门 Redis，因为 Redis 的用法实在太多了，你可以把它当作缓存，也可以把它当成数据库，甚至能把它当作消息队列。缓存可能大家都很熟悉了，在当数据库的方面 Redis 简直是潜力无限，大家一定要善用它的 bitmap 位图功能，简直能在面对复杂需求的时候玩出花来。比如说老板要统计所有用户一年中的登录天数，一个用户只需要 365bit（46B）的空间，相比于用传统的 mysql 不知道也节省多少倍的空间。

审核编辑黄昊宇

打开APP阅读更多精彩内容