本文是MySQL(三)|《千万级大数据查询优化》第一篇:创建高性能的索引的一个补充。
主要包括如下几点:
- 关于
sex
列创建索引的处理
sex可以理解为那种选择性不高,但是可能很多查询都会用到的列。考虑到使用的频率,还是建议在创建不同组合索引的时候将它作为前缀。
但是根据经验法则(将选择性最高的列放到索引最前列)不是说不应该在选择性低的列上创建索引吗?那为什么这里要将sex列字段作为索引的前缀列?这里有两个理由:
第一点,几乎所有的查询都会用到它;
第二点,索引中加上这一列也没有坏处,即使查询没有使用sex列也可以通过一些“诀窍”绕过,这个诀窍就是:如果每个查询不限制性别,那么可以通过在查询条件中新增AND SEX IN('m', 'f')
来让MySQL选择该索引。这样写并不会过滤任何行,和没有这个条件时返回的结果相同。但是必须加上这个列的条件,MySQL才能够匹配索引的最左前缀。 - 避免创建冗余和重复索引
重复索引的概念很好理解,我们也不会出现创建两个idx_ab
、idx_ab
的索引,很多时候是在不经意间创建的。关于冗余,就得做一个说明啦。举例如下,我在新建一个表时,要把ID设置为主键,必须保证它是唯一的,还要在它身上加上索引:
create table test(
ID INT NOT NULL PRIMARY KEY,
A INT NOT NULL,
B INT NOT NULL,
UNIQUE(ID),
INDEX(ID),
)ENGINE-InnoDB;
因为MySQL的唯一限制和主键限制都是通过索引实现的,所以实际上上面对ID创建了3个重复的索引。
如果创建了索引idx_ab
,再创建索引idx_a
就是冗余索引,创建索引idx_b
或idx_ba
都不是冗余索引。(这个冗余只是对B-Tree索引来说的)
- 找出未使用的索引,进行删除
除了冗余索引和重复索引,可能还会有一些服务器永远不用的索引,这种索引完全是累赘,需要删除。有很多工具可以帮助定位未使用的索引。 - 没有万金油般的索引,也没有放之四海而皆准的经验法则
经常在网上听到一些经验法则,包括我在上一篇文章中也提到过一些法则:
“在多列索引中将选择性最高的列放在第一列”、“应该为where子句中出现的所有列创建索引”…所有的法则都只是在特定场景才有效果。 - 定期维护索引和表
维护表有三个主要的目的:找到并修复损害的表,维护准确的索引统计信息,减少碎片。 - 对索引的优点做一个总结
索引的优点:
1)索引大大减少了服务器需要扫描的数据量。
2)索引可以帮助服务器避免排序和临时表。
3)索引可以将随机I/O变为顺序I/O。