2017.12.20
真题
请简述项目中优化sql语句执行效率的方法,从哪些方面,sql语句性能如何分析?Sql语句优化方法?
考点
一.查找分析速度慢的原因
记录慢查询日志
分析查询日志,不要直接打开慢查询日志进行分析,这样比较浪 费时间和精力,可以使用pt_query_digest工具进行分析。
使用show profile
set profiling=1开启,服务器上执行的所有语句会检测消耗的时间,存到临时表中。
show profiles
show profile for query临时表ID
使用show status
show status会返回一些 计数器,show global status查看服务器级别的所有计数。有时根据这些计数,可以猜测出哪些操作代价较高或者消耗时间多
使用show processlist
观察是否有大量线程处于不正常的状态或者特征
使用explain
分析单条sql语句
二.优化查询过程中的数据访问
访问数据太多导致查询性能下降
确定应用程序是否在检索大量超过需要的数据,可能是太多行或列
确定mysql服务器是否在分析大量不必要的数据行
避免使用如下sql语句
查询不需要的记录,使用limit解决
多表关联,返回全部列,指定a.id,a.name,b.age
总是取出全部列,select *会让优化器无法完成索引覆盖扫描的优化
重复查询相同的数据,可以缓存数据,下次直接读取缓存
是否在扫描额外的记录
使用explain来进行分析,如果发现查询需要扫描大量的数据,但只返回少数的行,可以通过如下技巧去优化:
使用索引覆盖扫描,把所有用到的列都放到索引中。
改变数据库,或表的结构,修改数据表范式。
重写sql语句,让优化器可以以更优的方式执行查询
三.优化长难的查询语句
一个复杂查询,还是多个简单查询
Mysql内部,每秒能扫描内存中上百万行数据,相比之下,响应数据给客户端,就要慢的多
使用尽可能少的查询是好的,但是有时将一个大的查询分解为多个小的查询是很有必要的。
切分查询
将一个大的查询分为多个小的相同的查询
一次性删除1000万的数据要比一次删1万,暂停一会的方案更加损耗服务器开销
分解关联查询
可以将一条关联语句分解成多条sql来执行
让缓存的效率更高
执行单个查询,可以减少锁的竞争
在应用层做关联可以更容易对数据库进行拆分
查询效率会大幅提升
较少冗余记录的查询
优化count()查询
count(*)中的*会忽略所有的行,直接统计所有列数,因此,不要使用count(列名)
MyISAM中,没有任何where条件的count(*)非常快
当有where条件,MyISAM的count统计比一定比其他表引擎快
四.优化特定类型的查询语句
可以使用explain查询近视值,用近视值替代count(*)
增加汇总表
使用缓存
优化关联查询
确定on或者USING子句的列上有索引
确保GROUP BY和ORDER BY中只有一个表中的列,这样MySQL才有可能使用索引
优化子查询
尽可能使用关联查询来替代
优化group by和distinct
来这两种查询,均可使用索引来优化,是最有效的优化方法
关联查询中,使用标识列进行分组的效率会更高。
如果不需要order by,进行group by时使用order by null,mysql不会再进行文件排序。
with rollup超级聚合,可以挪到应用程序处理
优化limit分页
limit偏移量大的时候,查询效率较低
可以记录上次查询的最大ID,下次查询时,直接根据ID来查询
优化union查询
union all的效率高于union
对于此类考题,先说明如何定位低效sql语句,然后根据sql语句可能低效的原因做排查,先从索引着手,如果索引没有问题,考虑以上几个方面,数据访问的问题。长难查询的问题,还是一些特定类型优化的问题,逐一回答。
索引面试题
数据库索引好比是一本书前面的目录,能加快数据库的查询速度
表中字段重复内容建立索引好,还是不重复内容建立索引好?为什么?
不重复内容建立索引好。重复内容没有必要建立索引,索引的底层是用二分法写的。会自动进行搜索。