一、什么是定时器
定时器(Timer)是一种在指定时间开始执行某一任务的工具(也有周期性反复执行某一任务的Timer)。它常常与延迟队列这一相关概念关联。
业务场景:
- 当订单一直处于未支付状态时,如何及时的关闭订单,并退还库存?
- 如何定期检查处于退款状态的订单是否已经退款成功?
- 新创建店铺,N天没有上传商品,系统如何知道该信息,并发送激活短信?
上述问题最简单直接的办法就是定时去扫表。每个业务都要维护一个自己的扫表逻辑。当业务越来越多时,我们会发现扫表部分的业务逻辑非常类似。将这部分逻辑从具体的业务逻辑里面抽出来,变成公共部分,就是定时器。
二、定时器的本质
一个定时器的本质是一种数据结构:deadline越近的业务具有越高的优先级,提供以下几种基本操作:
- Add 新增任务
- Delete 删除任务
- Run 执行到期的任务/到期通知对应业务处理
- Update 更新到期时间
Run 通常有两种工作方式:1.轮询,每隔一个时间片就去查找哪些任务已到期;2.睡眠/唤醒,不停的查找deadline最近的任务,如到期则执行;否则sleep直到其到期。在sleep期间,如果有任务被Add或Delete,则deadline最近的任务有可能改变,线程会被唤醒并重新进行1的逻辑。
设计目标通常包含以下几点要求:
- 支持任务提交(消息发布)、任务删除、任务通知(消息订阅)等基本功能。
- 消息传输可靠性:消息进入延迟队列以后,保证至少被消费一次(到期通知保证At-least-once,追求Exactly-once)。
- 数据可靠性:数据需要持久化,防止丢失。
- 高可用性:至少得支持多实例部署。挂掉一个实例后,还有后备实例继续提供服务,可横向扩展。
- 实时性:尽最大努力准时交付信息,允许存在一定的时间误差,误差范围可控。
三、数据结构
定时器通常与延迟队列密不可分,延迟队列是一种带有延迟功能的消息队列。延迟队列底层通常采用以下几种数据结构之一来实现:
- 有序链表,这个最直观,最好理解。
- 堆,应用例如Java JDK中的DelayQueue、Go内置的定时器等。
- 时间轮/多级时间轮,应用实例如Linux内核定时器、Netty工具类HashedWheelTimer、Kafka内部定时器等。
时间轮(TimeWheel),一个时间轮是一个环形结构,可以想象成时钟,分为很多格子,一个格子代表一段时间(越短的Timer精度越高),并用一个List保存在该格子上到期的所有任务,同时一个指针随着时间流逝一格一格转动,并执行对应List中所有的到期任务。任务通过取模决定应该放入哪个格子。如图所示:
如果任务的时间跨度很大,数量也多,传统的单轮时间轮会造成任务的round很大,单个格子的任务List很长,并会维持很长一段时间。这时可将Wheel按照时间粒度分级(与水表的思想很像),示意图如下所示: