自动补全也可以称为自动提示,类似于在百度搜索的输入框中输入一个字符,下面会提示多个关键词供参考。
假设:
输入 a,会自动提示 apple、application、acfun、adobe;
输入 ap,提示 apple、application;
输入 ac,提示 acfun;
输入 ad,提示 adobe。
看到这个功能需求,很简单的方式就是在数据库中直接使用 SQL LIKE 操作符来匹配,但是性能肯定是不行的。使用 Redis 倒是一个很不错的方案。
Redis 是 KV 型数据库,查询都是基于 key 的,key 值必须具有唯一性。
虽然通过 key 的通配符方式也可以实现自动提示,但是这种方法在 Redis 中数据量较大时也存在性能问题。
回到上面的话题,本质就是我希望通过 a 获取 apple、application、acfun、adobe,通过 ap 获取 apple、application,以此类推。那么,需要查询的值就应该作为 key,查询结果应该作为 value。遵循这个思路,可以利用 Redis 的集合存储这些值。为什么不用列表,而使用集合?因为我希望查询出来的词不会重复,而集合的特性就是元素唯一,性质决定用途,所以就使用集合。一般情况下,查询出来的词也会按照热度频率什么的排序,需要排序的话,就要使用 Redis 的有序集合。
以 word: 为前缀,方便管理和区别(保证唯一性),后面跟上要查询的值,例如:word:a(其实这样还是无法确保唯一性,就假设这个 key 在 Redis 中是唯一的)。
向集合中添加 关键词:
bash
ZADD word:a 0 apple 0 application 0 acfun 0 adobe ZADD word:ap 0 apple 0 application ZADD word:app 0 apple 0 application ZADD word:appl 0 apple 0 application ZADD word:apple 0 apple ZADD word:appli 0 application ……
上面还没有添加完成,完整添加的代码如下:
php
<?php namespace Blog\Redis; use \Redis; class Suggest { const PREFIX = 'word:'; protected $redis = null; public function __construct(Redis $redis) { $this->redis = $redis; } public function add($word) { $len = mb_strlen($word, 'UTF-8'); for ($i = 1; $i <= $len; $i++) { $sub = mb_substr($word, 0, $i, 'UTF-8'); $this->redis->zAdd(self::PREFIX . $sub, 0, $word); } } }
看以上代码,应该发现我给有序集合每个元素的 score 为 0,这个意义何在?不应该给每个词不同的 score,以便给搜索结果排序吗?确实如此,但是这样会存在一个问题:某一个词会出现在多个集合中,如果该词的热点要增加,那么就需要同时更新多个集合中该词的 score。这显然是不合理的。
那么到底应该怎么办哩?再创建一个有序集合,专门用于存放这些词和它们的 score。最后,将查询结合和这个记录热度的集合做交集,就能得出按热度排列后的结果。
设置这些词的热度:
bash
ZADD word_scores 100 apple 80 adobe 70 application 60 acfun
交集:
bash
ZINTERSTORE word_result 2 word_scores word:a WEIGHTS 1 1 ZRANGE word_result 0 -1 withscores
具体 PHP 实现代码如下,仅供参考:
php
<?php namespace Blog\Redis; use \Redis; class Suggest { const PREFIX = 'word:'; const WORDS_PREFIX = 'word_scores'; const RESULT_PREFIX = 'word_result'; protected $redis = null; public function __construct(Redis $redis) { $this->redis = $redis; } public function add($word) { $len = mb_strlen($word, 'UTF-8'); for ($i = 1; $i <= $len; $i++) { $sub = mb_substr($word, 0, $i, 'UTF-8'); $this->redis->zAdd(self::PREFIX . $sub, 0, $word); } } public function incScore($word, $score = 1) { return $this->redis->zIncrBy(self::WORDS_PREFIX, $score, $word); } public function search($keyword, $stop = 5) { $this->redis->zInter(self::RESULT_PREFIX, array(self::PREFIX . $keyword, self::WORDS_PREFIX), array(1, 1)); return $this->redis->zRevRange(self::RESULT_PREFIX, 0, $stop, true); } }