redis生产实战

2023年2月6日 173次阅读来源: 小吴可是全村的希望

redis原理简单介绍

redis 3x版本已支持集群模式，集群之间的各个节点至少需要两个TCP连接：一个是为客户端服务的监听端口，一个用于集群之间各个节点的通信。集群版本并没有用到普通的hash算法来对数据进行分区存储，因为当集群中节点有变动（增加节点或者删除节点）的时候会做rehash，rehash会移动集群中很多的数据，这样当集群中数据较多的时候，效率会比较低（hashmap的实现原理中，如果需要扩容的话就需要rehash），redis采用的是hash slot（hash槽，这里并没有用一致性hash算法）来实现的，部署redis集群的时候，会对集群中的每一个节点的ip做运算：CRC16(ip) % 16384 （CRC算法见：[https://wenku.baidu.com/view/85758f36eefdc8d376ee3256.html][1]），得到一个值后将这个值映射到hash环上。当我们要往redis里面存储一个k-v的时候，redis会对key做计算：CRC16(key) % 16384，计算出来的值也会映射到hash环上的某一个slot，这个数据会存储到其顺时针方向的第一个节点上，获取数据的时候也是先对key做运算，找到其对应的hash slot位置，然后顺时针第一个节点就是其存储节点。

一致性hash算法

对机器ip进行hash（hash(IP) % N，这里的指的是节点IP，N指的是集群节点数量）之后得到一个值，将这个值映射到hash环上面，然后将数据对象的key也做同样的hash算法，不过IP换成对象的key，同样将值映射到hash环上，然后顺时针找到第一个节点进行存储，当有节点增加时，将当前节点逆时针方向的数据转移到新增节点上，当有节点删除时，将当前节点逆时针方向的数据转移到其顺时针的下一个节点。

hash环

hash环其实是一个环形的hash空间，对key做一定的hash算法，然后映射到一个0~(2^32)-1的数字环形空间中

虚拟节点

我们考虑一个问题，当集群中节点数量较少时，比如只有A，B两个节点，这时候很有可能会导致很多的数据存储在某一个节点上。为了解决这个问题，引入了虚拟节点，对A和B各自虚拟出A1，A2，A3，B1，B2，B3节点（一般是在节点IP后面再加上数字来表示虚拟节点），将虚拟节点进行hash计算后分布在hash环上，这样，数据就会更加均匀的分布了（跟买股票基金差不多一个道理，鸡蛋不要放在一个篮子里，均摊风险）

redis过期key的处理

当一个redis的key被设置了过期时间，这个key过期了之后，redis服务器是如何处理这个key的呢？有时候redis服务器内存占用率过高，可能会是什么原因引起的呢？
第二个问题可能原因之一就是因为redis服务器中过期key过多导致。redis key过期的三种删除策略：

1. 被动删除（也成为惰性删除）：当读/写一个已过期的key时，会出发惰性删除策略，直接删除掉这个过期key
2. 主动删除：由于惰性删除策略无法保证冷数据被及时删除掉，所以redis会定期删除掉一批已经过期的key
3. 当前已用内存超过maxmemory限定时，出发主动清除策略

redis实际用法

如何运维部署这里不多提及，简单说一下在java中的实际用法。redis支持k-v形式的存储，value可以是String，Hash，List，Set，Sorted set等，我们自己实际项目中用到的是jedis客户端。

1、生成订单号 & 计数器
如果在同一个jvm中，大并发的情况下生成订单号，我们可以利用加锁(synchronized或者Lock接口或者并发包中的Automatic原子操作都可以)的机制来生成订单号（时间戳+随机数），或者使用线程号+时间戳+随机数也可行。但是如果是集群环境呢？使用synchronized或者Lock接口或者并发包中的Automatic在单个jvm里面都不能达到要求，这时候可以使用redis的原子递增方法来实现：incr，incr方法对key的value进行+1操作，如果key不存在，则value为1，很重要的一点是incr方法的原子性（参照AtomicInteger），如果不能保证原子性，那么会发生什么情况呢？对redis的key做+1操作：

    @Test
    public void test() throws InterruptedException {
        jedisUtil.set("index", "0");
        Thread[] threads = new Thread[1000];
        for(int i=0;i<1000;i++){
            Thread thread = new Thread(new Runnable() {
                @Override
                public void run() {
                    int index = Integer.parseInt(jedisUtil.get("index"));
                    index++;
                    jedisUtil.set("index", String.valueOf(index));
                }
            });
            threads[i] = thread;
        }

        for(int i=0;i<1000;i++){
            logger.info("当前启动线程为：{}", threads[i].getName());
            threads[i].start();
        }

        Thread.sleep(1000 * 10);
        logger.info("缓存中index的最终值为：{}", jedisUtil.get("index"));

    }

以上代码在1000个线程中同时运行，最终index的值不一定是1000，极有可能是一个小于1000的值。其中一个原因是，set和get操作并非一组原子性的操作，当线程A get(index)之后对index值做了加1操作，并未set的时候，这时候线程B也get(index)，这时候他get的值还是未加1的值，所以出现了小于1000的情况（这里的index++操作也不是原子性的，也会导致index的最终值变小）。解决这个问题的办法就是使用redis的incr或者incrBy方法，incrBy方法可以自定义加多少。代码修改如下：

@Test
    public void test() throws InterruptedException {
        jedisUtil.set("index", "0");
        Thread[] threads = new Thread[1000];
        for(int i=0;i<1000;i++){
            Thread thread = new Thread(new Runnable() {
                @Override
                public void run() {
                    jedisUtil.incrBy("index", 1l); // 修改此处
                }
            });
            threads[i] = thread;
        }

        for(int i=0;i<1000;i++){
            logger.info("当前启动线程为：{}", threads[i].getName());
            threads[i].start();
        }

        Thread.sleep(1000 * 10);
        logger.info("缓存中index的最终值为：{}", jedisUtil.get("index"));

    }

这样修改之后我们得到的最终值就是1000啦~~~！所以在集群中，并发量高的情况下，可以使用incr或者incrBy方法来生成订单号（订单号的随机数部分），或者作为计数器

2、分布式锁
何谓分布式锁，在分布式应用中，不同系统分布在不同的主机中，当他们需要争抢同一个资源的时候，且必须互斥的时候，可以设定一把锁，谁拿到了这把锁，谁就可以获得资源，这个锁在分布式应用中一般称为分布式锁。比如我们在调度系统中，集群环境中的任务调度系统在执行某个任务的时候，只能有一台服务器执行成功，这时候我们就用到了分布式锁。redis采用单进程单线程的方式处理客户端请求，将所有客户端请求变成串行执行，3X的集群版本也能保证一致性，所以redis的这个特性就非常适合提供分布式锁的功能。redis提供了setnx方法，全称是set if not exists，即如果不存在就set，当且仅当key不存在的时候才能set成功，并返回1，如果key已经存在了，则返回0，setnx是原子性的操作。比如我们需要在晚上11点由定时任务去拉取保险公司给的保单收益文件，如果多台服务器同时去拉取收益文件做计算是浪费资源，且业务上也可能出错，这时候可以使用setnx方法，设定一个key，比如是syncpolicytask，setnx这个key的时候（value随意设置），哪个应用设置成功了，哪个系统就来执行task，其他应用不执行。伪代码如下：

public static final String KEY = "syncghpolicytask";
if(jedisUtil.setnx(KEY_ORDER_SYNCGHPOLICYTASK, "true") == 0){
    return;
}
doSyncghPolicyTask...

<font color=’red’>生产上发生的一个bug：</font>
做保险的时候，有一个赠险的业务需求，就是赠送客户一些一元意外险，旅游险等这样的小保险。当时所有的赠送保险列表是存在数据库中的，前端显示的时候：
a. 先去缓存中查询是否有赠险列表，如果有，直接返回
b. 没有的话就从数据库去查询
c. 将数据库中查询出来的赠险列表更新到缓存中
以上其实是一个缓存使用的基本3个步骤。初期赠险的部分代码如下：

    String key = "赠险列表key";
    // 如果缓存中存在赠险列表，直接获取返回
    if(jedis.exists(key)) {
        // jedis客户端返回的是List<String>，需要自己转换成对象，这里省略了
        return jedis.lrange(key, 0, -1);
    }
    
    // 如果缓存中没有，去数据库里面获取
    List<Insurance> insuranceList = getInsuranceListFromDb();
    
    // 把查询出来的赠险列表更新到缓存中
    for(Insurance insurance : insuranceList) {
        jedis.rpush(key, JSON.toJSONString(insurance));
    }
    
    return insuranceList;

以上代码在测试环境没有问题，但是公司线下活动给客户领取赠险的时候发生了非常尴尬的事情，赠险列表出现了多条同样的赠险，排查后发现以上代码在并发量高的情况下会导致缓存并发，设想当A服务器的线程A从数据库中查询出来了赠险列表，但是还未更新到redis中，这时候B服务器的线程B也来了，他去redis查询也是查不到列表的，这时候也会去DB中查，最终导致两个线程都把赠险列表更新到了redis中。由于是集群环境，所以不能使用jdk提供的锁机制来控制并发，在这种情况下，A和B肯定只能有一个线程去更新缓存中的值，所以我们可以用到上面提到的分布式锁来做控制，修改后代码如下：

    String key = "赠险列表key";
    String lockKey = "分布式锁key"; 
    // 如果缓存中存在赠险列表，直接获取返回
    if(jedis.exists(key)) {
        // jedis客户端返回的是List<String>，需要自己转换成对象，这里省略了
        return jedis.lrange(key, 0, -1);
    }
    
    // 如果缓存中没有，去数据库里面获取
    List<Insurance> insuranceList = getInsuranceListFromDb();
    
    // 把查询出来的赠险列表更新到缓存中
    if(jedisUtil.setnx(lockKey, "true" , 1) == 0) { // 抢夺锁成功才能更新缓存
        try {
            // 抢夺锁成功之后还需要判断一次，这里是防止在A线程判断完缓存中没有列表然后查询完数据库
            // 之后，B线程往缓存中更新了赠险列表，且刚好释放了锁，这时候A拿到了锁又会去更新一次缓
            // 存，其实和单例模式中的"双重检测"机制是一样的道理
            if(jedis.exists(key)) {
                return insuranceList;
            }
        
            for(Insurance insurance : insuranceList) {
                jedis.rpush(key, JSON.toJSONString(insurance));
            }
        } finally {
            jedis.delnx(lockKey); // 删除key，释放分布式锁
        }
       
    }
    
    return insuranceList;

分布式锁不仅仅只有redis能提供，zookeeper其实也能提供，参见zookeeper一章。

3、实现简单队列功能
消息队列一般采用rabbitmq或者activemq(关于mq的信息可以看下”我用过的rabbitmq”一章)，<font color=’red’>消息队列一个非常重要的特点就是不阻塞请求，服务端异步处理，个人觉得可以理解成为一个缓冲的作用</font>，当前端请求量过大的时候，可以使用消息队列来缓冲某一时刻请求量过大对数据库造成的压力。redis提供的队列功能主要靠其list结构的数据存储，通过lpush方法往队列头部塞一个消息数据（即生产者消费者模式中的消息生产者），通过rpop方法从队列尾部获取一个消息并删除该消息，或者使用rpoplpush来消费一个消息，并缓存这个消息，如果消息处理失败，可以从缓存的队列中获取这个消息重新消费。简单代码如下：

producer:
    String key = "order:pay";
    String msg = " 'orderId':'12345678', 'amount':'1.00' ";
    jedis.lpush(key, msg);
    
consumer:
    String key = "order:pay";
    while(true) {
        String msg = jedis.rpop(key);
        // 处理msg逻辑略
    }

其实redis的队列功能是非常简单的，轻量级的，健壮性不太好（比如没有做负载，没有监控等等），所以生产上基本都是使用rabbitmq来作为消息队列。

SOA服务中，redis用途广泛，还有很多有趣的用法等着我们去发掘。
[1]: https://wenku.baidu.com/view/85758f36eefdc8d376ee3256.html

    原文作者：小吴可是全村的希望
    原文地址: https://www.jianshu.com/p/450aafa99bd5
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。