一.关系型数据库
定义:关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织;
优点:
1.易于维护:都是使用表结构,格式一致;
2.使用方便:SQL语言通用,可用于复杂查询;
3.复杂操作:支持SQL,可用于一个表及多个表之间非常复杂的查询;
缺点:
1.读写性能比较差,尤其是海量数据的高效率读写;
2.固定的表结构,灵活度稍欠;
3.高并发读写需求,传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。
二.非关系型数据库
定义:非关系型数据库严格上不是一种数据库,应该是一种数据结构化存储方法的集合,可以是文档或者键值对;
优点:
1.格式灵活:存储数据的格式可以是key,value形式、文档形式、图片形式等等,文档形式、图片形式等等,使用灵活,应用场景广泛,而关系型数据库则只支持基础类型。
2.速度快:nosql可以使用硬盘或随机存储器作为载体,而关系型数据库只能使用硬盘;
3.高扩展性;
4.成本低:nosql数据库部署简单,基本都是开源软件;
缺点:
非关系型数据库的分类和比较:
1.文档型
2.kry-value型
3.列式数据库
4.图形数据库
Web日志挖掘:主要挖掘的就是服务器的日志信息;
数据仓库挖掘:主要是关系型数据仓库。