[TOC]
前言
一个项目刚开始的时候是为了实现基本功能,随着版本和功能的迭代,大数据和高并发成了软件设计必须考虑的问题!
本质很简单,一个是慢,一个是等。
两者是相互关联的,因为慢,所以要等,因为等,所以慢,解决了慢,也就解决了等,解决了等,也就解决了慢。
关键是如何解决慢和等,
核心 一个是短,一个是少,一个是分流,最后一个是集群/横向扩张/读写分离/建立主从
短
是指路径要短
- 页面静态化- 用户可以直接获取页面,不用走那么多流程,比较适用于页面不频繁更新。
- 使用缓存– 第一次获取数据从数据库准提取,然后保存在缓存中,以后就可以直接从缓存提取数据。不过需要有机制维持缓存和数据库的一致性。
- 使用储存过程-那些处理一次请求需要多次访问数据库的操作,可以把操作整合到储存过程,这样只要一次数据库访问就可以了。
- 批量读取 – 高并发情况下,可以把多个请求的查询合并到一次进行,以减少数据库的访问次数
- 延迟修改 – 高并发情况下,可以把多次修改请求,先保存在缓存中,然后定时将缓存中的数据保存到数据库中,风险是可能会断电丢失缓存中的数据,
- 使用索引 – 索引可以看作是特殊的缓存,尽量使用索引就要求where字句中精确的给出索引列的值。
少
是指查询的数据要少:
- 分表 – 把本来同一张表的内容,可以按照地区,类别等分成多张表,很简单的一个思路,但是要尽量避免分出来的多表关联查询。
- 分离活跃数据 – 例如登录用户业务,注册用户很多,但是活跃的登录用户很少,可以把活跃用户专门保存一张表,查询是先查询活跃表,没有的话再查总表,这也类似与缓存啦。
- 分块 – 数据库层面的优化,对程序是透明的,查询大数据只用找到相应块就行。
分流
- 集群 – 将并发请求分配到不同的服务器上,可以是业务服务器,也可以是数据库服务器。
- 分布式 – 分布式是把单次请求的多项业务逻辑分配到多个服务器上,这样可以同步处理很多逻辑,一般使用与特别复杂的业务请求。
- CDN – 在域名解析层面的分流,例如将华南地区的用户请求分配到华南的服务器,华中地区的用户请求分配到华中的服务器。
- 分库分表 –
水平拆分【分表】:
对于访问极为频繁且数据量巨大的单表来说,首先要做的是减少单表的记录条数,以便减少数据查询所需的时间,提高数据库的吞吐,这就是所谓的分表【水平拆分】
垂直拆分【分库】:
是根据业务耦合性,将关联度低的不同表存储在不同的数据库上,对数据库进行拆分,从而提高数据库写入能力,即分库【垂直拆分】
- 建立主从 – 读写分离就是只在主服务器上写,只在从服务器上读,基本原理是让主数据库处理事务性查询,而从数据库处理select查询,数据库复制被用于把事务性查询(增删改)导致的改变更新同步到集群中的从数据库。