如果这篇文章对你有帮助请帮忙点个赞吧!
第一章 数据库应用系统开发方法
1, 数据库应用系统DBAS是一类典型的面向数据管理和数据处理的复杂软件系统。
2, DBAS的生命周期由项目规划、需求分析、系统设计、实现与部署、运行与维护五个基本活动组成。
3, DBAS设计阶段细分为概念设计、逻辑设计、物理设计三个步骤。
4, 规划与分析的主要工作内容:系统规划与定义(包括人物陈述,确定任务目标,确定范围和边界,确定用户视图),可行性分析(包括技术可行性,经济可行性,操作可行性,开发方案选择),项目规划。
5, 需求分析过程包括需求获取,需求分析,需求描述与规范说明,需求验证等步骤。
6, 需求分析还包括:
数据需求分析:分析各类数据项与数据结构,形成数据字典
功能需求分析:数据处理需求分析,业务规则需求分析
性能需求分析:数据操作响应时间,系统吞吐量,允许并发访问最大用户数,每TPS(Price per TPS)代价值(用于衡量系统性价比的指标)
其他需求分析:存储需求,安全性需求,备份和恢复需求。
7, 概念设计包括数据库概念模型设计,系统总体设计。
8, 逻辑设计包括数据库逻辑结构设计,应用程序概要设计,数据库事务概要设计。
9, 物理设计包括数据库物理结构设计,数据库事务详细设计,应用程序详细设计。
10, DBAS的实现与部署:建立数据库结构,数据加载,事务和应用程序的编码及测试,系统集成测试与试运行。
11, 运行管理与维护:日常维护,监控与分析,性能优化调整,系统进化
12,数据库管理系统三级模式,外模式(概念设计),模式(逻辑设计),内模式(物理设计)。提供两层映像机制,其中模式/内模式实现了物理独立性,外模式/模式提供了逻辑独立性。
13,SQL Sever 有5种约束类型,分别是主键约束、外键约束、唯一性约束、缺省约束和检查约束。
14,完整性约束分为列级,元组级,数据库级,关系级。
15,数据库管理系统为用户和应用程序提供了DDL语言,用此语言定义数据库的模式结构。此语言执行后的结果不能回滚。
16,关系数据库中视图提供了逻辑数据独立性。
本章内容常考题型主要是选择和填空,需要大家对数据库应用系统的开发流程以及每一步骤包含的内容有一个总的认识,没有什么难点,只要记记背背就可以。其中常考的内容有概念设计,逻辑设计,物理设计活动的区分上面,例如:
例1:关于数据库应用系统设计,有下列说法:
I,数据库应用系统设计需要考虑数据组织和存储,数据访问与处理,应用设计几个方面。
II,数据库概念设计阶段,采用自上而下的ER设计时,首先设计局部ER图,然后合并各局部ER图得到全局ER图。
III,在数据库逻辑结构设计阶段,将关系模式转换为具体DBMS平台支持的关系。
IV,在数据库物理设计阶段,一般需要设计视图和关系模式的完整性约束。
上述说法正确的是(B)
A:I、III和IV
B:I
C:II和III
D:II和IV
解析:
概念设计活动包括:采用自上而下的ER设计等。
逻辑设计活动包括:将ER图转化为关系模式,设计视图和关系模式完整性约束等。
物理设计活动包括:将关系模式转换为具体DBMS平台支持的关系表,确定关系表的文件组织形式,创建必要的索引,设置存储分配参数等。
例2:下列不属于数据库应用系统物理设计阶段活动的是(D)
A:数据库物理结构设计
B:数据库事务详细设计
C:应用程序详细设计
D:数据库备份和恢复设计
第二章 需求分析
本章内容主要需求以及需求分析的概念,获取需求的过程,以及介绍主要的建模方法DFD,IDEF0等,通过需求分析,最终形成一个需求分析文档。
1,需求获取的方法:面谈、实地观察、问卷调查、查阅资料。
2,DFD建模方法的核心是数据流,基本元素包括数据流(箭头),处理(矩形),数据存储(圆角矩形),外部项(平行四边形)。
3,信息系统需求分析常用的建模方法有DFD,IDEF0,UML。ER图不属于常用的信息系统需求分析建模方法。
4,在IDEF1中,多对多联系又称为非确定联系。
5,检查确认DFD图:父图中描述的数据流必须要在相应的子图中出现;一个处理至少有一个输入流和一个输出流;一个存储必定有流入的数据流和流出的数据流;一个数据流至少有一端是处理框。
6,IDEF0的基本元素:矩形框和箭头,矩形框代表功能活动。左-输入,右-输出,上-控制,下-机制。
7,顶层的DFD包含的处理有1个。
本章内容常考题型主要是选择和填空,其中常考的内容有需求分析的建模方法,判断模型建立数据流程图是否正确等。例如:
例1:在IDEF0需求建模方法中,下列关于从属实体集的描述,错误的是(B)
A:不同从属实体集可以依赖同一独立实体集。
B:从属实体集只能参与标定型联系。
C:从属实体集用圆角矩形框表示。
D:从属实体集的主码来自于所依赖的独立实体集的属性集。
例2:在IDEF1X建模方法中,学生和图书之间的借阅联系属于(A)
A:非确定型联系
B:非标定型联系
C:标定型联系
D:分类联系
解析:所有实体集的联系必须用确定联系来描述,
不允许出现不确定的联系,故需将多对多联系转化为多个一对多联系。
而此处的学生和图书的借阅联系属于多对多联系,一个学生可以借阅多本图书,一本图书可以借阅给多名学生。
第三章 数据库结构设计
本章主要内容包括对系统进行概念结构设计,逻辑结构设计以及物理结构设计。
1,数据库概念设计的过程主要包含明确建模目标,定义实体集,定义联系信息模型,确定实体集属性,对信息模型集成和优化。
2,ER建模方法(简答题必考),搞清楚实体,属性以及三种联系(一对一,1对多,多对多)如何表达。关系当中哪个是主键,哪个是外键。
2,范式:
1NF:其 属性都是不可再分的基本数据项。如:关系R(学号,姓名,(性别,年龄))这个关系就满足1NF。
2NF:R属于1NF,每个非主属性完全函数依赖于主码。也即消除部分依赖。
3NF:R属于2NF,并且R中的每个非主属性不传递依赖。第三范式的模式一定不包含部分函数依赖和传递函数依赖。也即在第二范式的基础上,消除传递函数依赖。
BCNF:BCNF是3NF的改进式,在R属于3NF的基础上,不允许主键的一部分被另一部分或者其他部分决定
。
范式 | 含义 |
---|---|
1NF | 其 属性都是不可再分的基本数据项。如:关系R(学号,姓名,(性别,年龄))这个关系就满足1NF |
2NF | R属于1NF,每个非主属性完全函数依赖于主码。也即消除部分依赖 |
2NF | R属于1NF,每个非主属性完全函数依赖于主码。也即消除部分依赖 |
3NF | R属于2NF,并且R中的每个非主属性不传递依赖。第三范式的模式一定不包含部分函数依赖和传递函数依赖。也即在第二范式的基础上,消除传递函数依赖 |
BCNF | BCNF是3NF的改进式,在R属于3NF的基础上,不允许主键的一部分被另一部分或者其他部分决定 |
依赖包括
函数依赖:自变量x确定了,相应的y=f(x)的y也确定了。
函数依赖 | 含义 |
---|---|
完全函数依赖 | 对于每一个X,都有与之对应的Y,而X中的任意一部分,都没有对应的Y。如:学号->姓名 |
部分函数依赖 | 对于每一个X,都有与之对应的Y,而X中的任意一部分,也有对应的Y 。如:(学号,课程)->姓名,其中学号->姓名 |
传递函数依赖 | X->Y,Y->Z,也即X->Z 。如学号->系名,系名->班主任 |
4,数据库逻辑结构设计与数据库具体物理实现无关。
5,从数据库物理结构角度需要解决如下问题:
文件组织,文件结构,文件存取,索引技术。
6,索引技术的关键是建立记录域取值到记录的物理地址间的映射关系,主要分为有序索引(利用索引文件)和散列索引(利用哈希函数)。
7,一个数据文件可以有多个查找码和索引文件。
8,有序索引中,是否按照其查找码指定顺序与数据文件中的记录顺序相一致,分为聚集索引和非聚集索引。
9,在一个数据文件上除了可以建立一个聚簇索引外,还可以建立多个非聚簇索引。
10,索引顺序文件:如果一个数据文件按照某个查找码组织为顺序文件,同时在该数据文件上又有聚集索引,则该数据文件称为索引顺序文件。
11,稠密索引与稀疏索引:
如果数据文件中每个查找码值在索引文件中都对应一个索引记录,则该索引称为稠密索引,查找速度快。
如果索引文件只包含了数据文件中的部分查找码,则该索引称为稀疏索引。
12,主索引与辅索引:在数据文件主码属性集上建立的索引叫主索引,在数据文件非主码属性集上建的索引叫辅索引。
13,唯一索引可以确保索引列不包含重复的值。
14,基本表选择合适文件结构的原则:
堆文件:当数据文件数据量少,频繁插入,删除或者更新操作。
顺序文件:当用户查询条件定义在查找码上面。
散列文件:当用户查询是基于散列阈值的等值匹配,尤其是访问顺序是随机的。
15,基本表是否建立索引的原则(选择,简答)
※ 经常需要查询,连接统计操作,且数据量大的表,可建立索引。
※ 通常在表的主码,where查询中使用率较高的属性,参与连接操作的属性,group by,order by 的属性 ,这些属性上面建立索引,可以加快查询效率。
16,应用数据的划分与分布:水平划分与垂直划分(分布式数据库系统比较常用),根据时间地点划分,根据数据使用特征划分。
17,垂直划分是将一张基本表划分为多张子表,每张子表必须包含基本表的主键。
本章内容常考题型主要是选择和填空,其中常考的内容有一个关系的范式判别以及函数依赖的判别,ER图的画法(必考),索引的分类区分,例如:
例1:设有关系模式R(A,B,C,D),存在函数依赖集:{A->B,C->D},则R最高可属于(A)
A:1NF B:2NF C: 3NF D:BCNF
第四章 数据库应用系统功能设计与实施
1,DBAS体系结构:客户/服务器体系结构(C/S),此客户端除了完成人机交互功能之外,还要面向应用的数据处理功能,负荷较重,是胖客户端,三层浏览器/服务器结构(B/S),客户端由浏览器担任,只需要完成人机交互功能,是瘦客户端。
2,从功能角度,DBAS系统通常可以划分为4个层次实现:
表示层:负责所有与用户交互的功能。一个好的用户界面应该容忍用户在使用过程中发生的各种操作错误。
业务逻辑层:连接数据访问层与表示层,将数据进行处理和传送。主要任务是梳理DBAS的各项业务活动,将其表示为各种系统构件。
**数据访问层:**负责与DBMS系统交互。主要任务是针对DBAS的数据处理需求设计用于操作数据库的各类事务。
数据持久层:负责保存和管理应用系统数据。
3,事务是一个数据库系统的逻辑数据处理单元,其中包含了一系列的数据操作集合。
4,数据库的安全性保护方式有:用户身份鉴别,权限控制,视图机制。
5,DBAS实施包括:创建数据库,装载数据,编写和调试应用程序,数据库试运行。数据库实施完成之后,就进入数据库运行与维护阶段。
6,创建数据库时需要考虑以下因素:初始空间大小,数据库增量大小,访问性能。
7,DBAS功能概要设计的目标是产生软件的总体结构和软件功能模块。
本章内容常考题型主要是选择和填空,其中常考的内容有DBAS两种体系结构以及4个实现层次的区分,例如:
例1:从功能角度数据库应用系统可以划分为4个层次来实现,设计web界面的任务属于(A)
A:表示层 B:业务逻辑层 C:数据持久层 D:数据访问层
例2:从功能角度数据库应用系统可以划分为4个层次实现,根据事务-基本表交叉引用矩阵来调整数据文件的组织结构,这一任务涉及(C)
A:业务逻辑层 B:表示层 C:数据持久层 D:数据访问层
第五章 UML与数据库应用系统
1,统一建模语言UML是一种定义良好,易于表达,功能强大,通用的可视化建模语言。
2,UML语言定义在一个四层建模概念框架中:元元模型,元模型,模型,用户模型。
3,UML2.0 提供了13种不同的图,主要分为:
结构图:用于系统静态结构建模,包括类图,对象图,复合结构图,包图,组件图,部署图。
行为图:用于对系统动态行为建模,包括用例图,交互图(顺序图,通信图,交互概述图,时间图),状态图和活动图。
4,顺序图主要用于描述系统内对象之间的消息发送和接收序列。
5,组件图表示系统的静态实现视图,展现了一组组件之间的组织和依赖,用于对源代码、可执行的发布,物理数据库等系统建模。
6,UML对包定义了公有,私有,保护,实现四种可见性。
7,UML中,圆角矩形表示活动,箭头线表示活动之间的转换,其上的标注为执行下一活动的条件。
8,类与类之间通常有关联,继承(空心三角形),依赖,精化四种关系。
9,在UML中,用例模型由用例、系统和角色3部分组成。
本章内容常考题型主要是选择和填空,其中常考的内容有各个图的概念与辨别以及关系的辨别,例如:
例1:在UML模型中,用于表达一系列的对象、对象之间的联系以及对象间发送和接收消息的图是通信图。
第六章 高级数据查询
本章内容涉及到数据查询,也是日常工作当中经常用到的技能,需要大家多多练习。
1,TOP:
Select top 3 with ties GoodsName from Table_name order by GoodsName;
2,CASE WHEN
3,并运算 UNION
:UNION
合并时会自动剔除重复项,UNION ALL
则会将重复项保留。
4,交运算 INTERSECT
5,差运算 EXCEPT
6,子查询 IN,EXISTS,NOT EXISTS
7,开窗函数:row_number over(partitions by ***)
8,sum(),avg(),min(),max(),count()
函数的使用。
9,开窗函数:
※ RANK() over(partition by id order by money desc)
存在并列的情况,并且并列的排名后面会产生间断。
※ DENSE_RANK() over(partition by id order by money desc)
排名可重复,排名中间不会产生间断的情况,是连续的整数。
※ NTILE() over(partition by id order by money desc)
会将行划分到指定数目的组中,返回此行所属组的编号。
※ ROW_NUMBER() over(partition by id order by money desc)
排名不重复。
10,group by
分组:group by name having count(*)>1
查询有重复出现的name.
11,order by
根据某一列升序ASC或者降序DESC排序。
12,where
子句和group
子句,最先执行的是group
子句。
13,子查询执行的次数由外层表的行数决定。
14,包含相关子查询的查询语句,先执行外层查询,再执行内层查询。
15,对于包含基于集合测试子查询的查询语句,先执行内层查询,再执行外层查询。
本章主要考察的题型有选择,填空和简答,考察方式一般为给一段代码,将关键位置进行填空,或者是选择题,选出查询结果正确或者书写正确的代码,例如:
例1: 计算两个日期之差的函数是datediff
。
例2:SQL SEVER 2008 提供了4个排名函数,其中dense_rank
函数返回结果集中每行数据在每个分区内的排名,并且每个分区内行的排名从1开始,排名可重复但不间断。
第七章 数据库及数据库对象
1,5个系统数据库:
Master:记录sqlsever实例的所有系统级信息。
Msdb:保存关于调度报警、作业、操作员等信息。
Model:存放用户数据库公共信息。
Tempdb:临时数据库,用于保存临时对象或者结果集。
Resource:SQLsever中所有系统对象。
2,SQLSEVER数据库的组成:
数据文件,事务日志文件(每个数据库必须至少有一个日志文件),数据库存储空间分配。
3,数据库文件组:主文件组和用户定义文件组。
4,数据库文件初始大小,增长方式,最大大小都是需要定义的。
5,创建数据库语句 :
CREATE DATEBASE STUDERN_DATABASE
ON –创建指定数据文件
(
NAME= STUDERN_DATE
FILENAME =’d:\ STUDERN_DATE\ STUDERN_DATE.mdf’
SIZE = 10 – 初始大小10M
MAXSIZE = 30 – 最大大小30M
FILEGROWTH = 5 – 自动增长时增量为5M
)
LOG ON – 创建指定日志文件
(
NAME = STUDERN_LOG
FILENAME = ’d:\ STUDERN_DATE\
STUDERN_LOG.ldf’
SIZE = 3
MAXSIZE = 12
FILEGROWTH = 2
)
6,只有当文件完全为空时,才可以从数据库中删除文件。
7,分离数据库:将数据库从SQL SEVER实例中删除,但不删除数据库的数据文件和日志文件。
附加数据库:将分离的数据库重新附加到数据库管理系统中。
8,架构是数据库下面的一个逻辑命名空间,可以存放表、视图等数据库对象,它是一个数据库对象容器。
9,分区表是一个从物理上将一个大表分成几个小表,但从逻辑上来看还是一个大表。
10,创建索引
CREATE [UNIQUE][CLUSTERED] INDEX INDEX_NAME ON TABLE_NAME ( COLUMN_NAME )
11,建有唯一聚集索引的视图称为称为索引视图,也称为物化视图。
12,SQLSEVER
数据库中数据的存储分配单位是数据页。
13,一个数据页的大小是8KB。
14,主要数据文件的推荐拓展名是.mdf
,日志文件的推荐拓展名是.ldf
。
15,一个数据库中可包含0到多个次要数据文件。
本章内容常考题型主要是选择和填空,其中常考的内容有计算数据存储效率以及创建数据库相关细节等等,如:
例1:下列关于SQL SEVER2008数据库文件组的说法,错误的是(C)
A:一个数据库可以包含多个文件组
B:一个文件组可以包含多个数据文件
C:次要数据文件不能放在主文件组中
D:一个数据文件不能是多个文件组的成员
第八章 数据库后台编程技术
1,SQLSEVER2008
支持两类用户定义函数:标量函数和表值函数,标量函数只返回单个数据值,表值函数将返回一个表。
2,触发器是一种特殊的存储过程,需对表数据进行UPDATE,INSERT,DELETE
操作时,自动触发执行。这样可以保证业务规则和数据完整性。
3,INSTEAD OF
:前触型触发器,在引发的SQL语句中指定的操作都已成功执行,并且所有的约束检查也成功完成后,才执行此触发器。
4,FOR|AFTER
:后触型触发器,指定执行触发器而不是执行引发触发器执行的SQL语句。
5,@@FETCH_STATUS
返回FETCH语句执行后的游标最终状态。其中:
0 成功,-1 失败,-2 提取的行不存在。
6,利用存储过程机制,可以提高数据操作效率。
7,打开游标的语句是OPEN CURSOR
。
8,释放游标:deallocate cursor
。
本章内容常考题型主要是选择,填空和简答,其中常考的内容有存储过程,函数,触发器的编写(简答)以及前触发器与后触发器的区别(判断,填空),如:
例1:
CREATE PROC P1
@X INT,
@Y INT,
@Z INT OUTPUT AS…
请补全下列调用该存储过程的语句:
DECLARE @S INT
EXEC P1 20,30,@S OUTPUT;
例2:下列关于SQL Sever2008触发器的说法,错误的是(B)
A:触发器可以实现复杂的完整性约束。
B:在一个表上可以为同一个操作建立多个前触发型触发器。
C:对DML型触发器,引发触发器执行的操作只能INSERT,DELETE和UPDATE。
D:使用触发器实现数据完整性的效率通常低于CHECK约束。
第九章 安全管理
1,数据库安全性指:保护数据以防止不合法用户故意造成的破坏。
2,数据库完整性指:保护数据以防止合法用户无意中造成的破坏。
3,身份验证模式:Windows身份验证模式 ,混合身份验证模式
4,固定服务器角色:
Bulkadmin
:具有执行BULK INSERT
权限。
Dbcreator
:具有创建、修改、删除、还原数据库的权限。
Diskadmin
:具有管理磁盘文件的权限。
Processadmin
:具有管理运行在SQL SEVER
中进程的权限。
Securityadmin
:对于专门管理登录账户、读取错误日志以及执行create database
的权限。
Severadmin
:具有设置服务器级别的配置选项和关闭服务器的权限。
Setupadmin
:仅限于添加和删除链接服务器。
Sysdamin
: 系统管理员角色。具有在服务器及数据库上执行任何操作的权限。
5,固定数据库角色:
Db_accessadmin
:具有添加和删除数据库用户的权限。
Db_backupoperator
:具有备份日志,备份数据库的权限。
Db_datareader
:具有查询数据库中所有用户数据的权限。
Db_datawriter
:具有插入,删除和更改数据库中所有用户数据的权限。
Db_ddladmin
:具有执行数据库定义语言的权限。
Db_denydatareader
:不允许具有INSERT,DELETE,UPDATE
数据库所有用户数据的权限。
Db_owner:
具有在数据库中进行全部操作的权限。
Db_securityadmin
:具有管理数据库角色。角色成员以及数据库中的语句和对象的权限。
6,数据库中的用户按照操作权限不同,分为系统管理员,数据库对象拥有者和普通用户。
7,SQL Sever
的登录账户来源有windows 和 非Windows 两种。
8,SQL Sever
将权限分为对象权限,语句权限和隐含权限。
9,grant create table to
U1 授权用户U1在DB1数据库中具有建表权限。
本章内容常考题型主要是选择,填空,其中常考的内容有几个固定服务器角色和数据库角色的区分,如:
例1:
在SQL SEVER2008中,只具有修改数据库中全部用户表数据权限的系统角色是db_datawriter
。
例2:
设在SQLSEVER2008
中,用户U1在DB1数据库中创建了#Temp
表。下列关于#Temp表的说法正确的是(A)
A:只有在创建#Temp的连接中才可以查询#Temp表的数据。
B:在所有用户U1发起的连接中,都可以查询#Temp表数据。
C:在创建#Temp表的连接为断开时,DB1数据库所有用户都可以查询#Temp表数据。
D:在创建#Temp的连接断开时,DB1数据库中所有的用户仍可以查询#Temp表数据。
例3:
下列关于SQL Sever2008安全管理说法,错误的是(C)
A:支持两种身份验证模式:“windows身份验证模式”和“混合身份验证模式”。
B:在“混合身份验证模式”下,允许Windows用户和非Windows用户登录到SQLSever上。
C:所有的windows用户默认都具有登录到SQL SEVER 的权限。
D:只有在“混合身份验证模式”下,sa才能登录到SQL Sever。
第十章 数据库运行维护与优化
1,数据库维护工作主要包括:数据库的转储和恢复,数据库的安全性和完整性控制,数据库性能的监控分析和改进,数据库的重组和重构。
2,数据库重组:不修改数据库原有设计的逻辑和物理结构。
数据库重构:部分修改数据库的模式和内模式。
3,监控分析机制有:自动监控机制和手动监控机制。
4,数据库性能优化:数据库运行环境,数据库参数调整,模式调整,数据库存储优化,查询优化等几个方面入手。
5,反规范化方法有:增加派生列,增加冗余列,重新租表,分割表,新增汇总表等。
本章内容常考题型主要是选择,填空和简答,其中常考的内容有如何根据实际情况进行数据库的优化,例如:
例1:优化SQL语句属于数据库应用系统运行管理和维护阶段的任务。
例2:某采购中心采购了一套商品批发查询管理系统,此系统采用SQLSEVER2008数据库管理系统,该系统需要经常处理百万级以上的数据查询。同时,该系统提供了第三方人员开发的SQL接口,第三方人员可以根据自己的需要开发自己的应用程序来访问数据库中的相关数据。
(1)系统使用过程中,业务人员反映系统操作速度很慢。经过工程师检查测试后,数据库系统本身及网络传输过程中存在着一些问题,请给出针对数据库系统本身及网络传输过程中可能的一些调优方案。
(2)工程师在完成数据库系统本身和网络问题优化后,发现第三方开发人员的SQL查询语句存在很多没有优化的问题,请从第三方开发人员的角度给出一些优化方案。
(1)答:
1,把数据,日志,索引放到不同的I/O 设备上,增加读取速度。
2,纵向、横向分割表,减少表的尺寸。
3,升级硬件,扩大服务器的内存,配置虚拟内存,增加服务器CPU个数。
4,分布式分区视图实现数据库服务器联合体,扩大一组服务器。
5,重建索引。
6,优化锁结构。
(2)答:
1,对查询进行优化,尽量避免全表扫描。
2,应尽量避免在where子句中使用!=或< >操作符。
3,任何地方都不要用select * from 进行全表扫描
4,避免频繁创建和删除临时表。
5,尽量避免使用游标,游标的效率差。
6,尽量避免大事务操作,提高系统并发能力。
第十一章 故障管理
1,故障类型:
事务内部故障:分为预期和非预期的。
※预期的事务内部故障指可以通过事务程序本身发现的事务内部故障。可通过事务回滚,撤销其对数据库的修改。
※非预期的事务内部故障指不能由事务程序处理的,如运算溢出,并发事务死锁故障。
系统故障:指由于硬件故障,数据库软件及操作系统的漏洞,突然停电等情况导致系统停止运转。
介质故障:又称硬故障,指物理存储设备损坏。
计算机病毒故障:是恶意的计算机程序,它可以像病毒一样传播和繁殖。
2,数据转储:
静态转储:静态转储过程中系统不能运行其他事务,不允许对数据库有存取,修改活动。
动态转储:允许转储操作和用户事务并发执行。但动态转储不能保证转储数据的一致性。
3,数据转储机制:
完全转储:对数据库中所有数据进行转储。
增量转储:只复制上次转储后发生变化的文件和数据块。
差量转储:对最近一次数据完全转储以来发生的数据变化进行转储。
4,多种数据转储方法结合使用:
仅使用完全转储,完全转储+增量转储,完全转储+差量转储。
5,以记录为单位的日志文件和以数据块为单位的日志文件。
6,磁盘保护技术RAID:镜像冗余和校验冗余。
7,RAID级别:RAID0,RAID1,RAID5,RAID10。
8,数据库镜像分成两种模式:双机互备援模式(两台主机均为工作机)和双机热备分模式(一台工作机,一台备份机)(简答)。
9,恢复机制涉及2个关键问题:1,如何建立冗余数据,2,如何利用它实施数据库恢复。
10,以记录为单位的日志文件内容包括三部分:开始标记,结束标记,每个事务的所有更新操作。
本章内容常考题型主要是选择和填空,其中常考的内容有数据库镜像模式以及数据库转储机制等:
例1:下列关于数据库故障及解决方法的说法,错误的是(A)
A:对于非预期的事务内部故障,一般需要管理人员人工干预恢复过程。
B:预期的事务内部故障可以将事务回滚,使数据库达到一致性状态。
C:数据库系统发生故障后需要进行UNDO和REDO两项工作。
D:采用硬件容错可以降低介质故障的影响。
第十二章 备份和恢复数据库
1,恢复模式:
简单恢复模式,完整恢复模式,大容量日志恢复模式。
2,简单恢复模式不支持事务日志备份。
3,SQL支持文件备份和差异文件备份。
4,事务日志备份:
纯日志备份,大容量操作日志备份,结尾日志备份。
5,常用备份策略:
完整数据库备份,完整数据库备份加日志备份,完整数据库备份加差异数据库备份再加日志备份。
6,第一次对数据库备份必须是完整备份。
7,SQL SEVER2008
中,在进行数据库备份时允许用户操作数据库。
8,对于数据库备份,SQL SEVER2008
支持三种备份方式:完整备份,差异备份,日志备份。
本章内容常考题型主要是选择和填空,其中常考的内容有如何根据实际情况完成数据备份等,
如:
例1:在SQL SEVER2008
中,下列关于数据库备份类型的说法,错误的是(C)
A:完整数据库备份+日志备份 策略的数据库恢复时间较长。
B:完整数据库备份+差异数据库备份+日志备份 策略的备份和恢复速度比较快。
C:完整数据库备份适用于数据库更改频繁,数据丢失造成影响比较大的情况。
D:仅使用差异数据库备份无法恢复数据库数据。
例2:现有一基于SQL Sever 2008
的商品销售系统数据库,若不允许丢失任何销售数据,则下列有关数据库应设置的恢复模式最恰当的是(D)
A:大容量日志恢复模式
B:简单恢复模式
C:关键日志恢复模式
D:完整恢复模式
解析:
简单恢复模式:可最大程度减少事务日志的管理开销,因为无需备份事务日志,如果数据库损坏,将会导致丢失数据的风险。
完整恢复模式:需要日志备份,理论上可以恢复到任意时点。
大容量恢复模式:是介于简单恢复模式的增大丢失数据风险与完整恢复模式的增大日志备份之间的一种模式。
第十三章 大规模数据架构
1,分布式数据库目标:
本地自治,非集中式管理,高可用性,位置独立性,数据分片独立性,数据复制独立性,分布式查询处理,分布式事务管理,硬件独立性,操作系统独立性,网络独立性,数据库管理系统独立性。
2,本地自治,非集中式管理和高可用性是分布式数据库最基本的特征。
3,数据分布策略:
从数据分片和数据分配的角度看:
数据分片:水平分片,垂直分片,导出分片,混合分片是以上3中分片方式的混合。
数据分配:集中式,分割式,全复制式,混合式。
4,分布透明性:
分片透明性:最高级别的透明性,位于全局概念模式和分片模式之间。
位置透明性:指数据分配的位置对于用户来说是透明的。用户只需考虑数据分片情况。
局部数据模型透明性:处于分配模式和局部概念模式之间,用户需要考虑数据分片和分配情况。
5,一个典型的分布式数据库管理系统结构图包括:全局数据库管理系统,全局数据字典,局部数据库管理系统,通信管理。
6,并行数据库系统结构:
共享内存结构:所有处理机通过互联网共享一个公共的主存储器。
共享磁盘结构:所有的处理机拥有独立的主存储器,通过互联网共享磁盘。
无共享结构:每个处理机拥有独立的主存储器和磁盘,不共享任何资源。
层次结构:顶层由由若干节点组成的无共享结构,底层是共享内存或共享磁盘结构。
7,数据划分:
轮转法:适用于扫描整个关系的应用。
散列划分:更加适合于点查询。
范围划分:适合范围查询和扫描整个关系。
8,云计算提供商的数据中心的软硬件设施就是所谓的云。云包括公有云,私有云,混合云。
9,谷歌使用的云计算基础架构模式包括:
文件系统GoogleFile System,
分布式编程环境Map/Reduce,
分布式锁机制Chubby,
Google开发的模型简化的大规模分布式数据库BigTable
10,分布式数据库的模式结构包括:全局外模式,全局概念模式,分片模式,分配模式,局部概念模式,局部内模式6部分,其中全局外模式是全局应用的用户视图。
11,两阶段加锁协议可以保证事务调度的可串行性。
12,在分布式数据库中,采用半连接操作可以减少场地之间的数据传输量。
本章内容常考题型主要是选择和填空,其中常考的内容有分布式数据库的分布策略以及数据划分等,如:
例1:在分布式数据库的数据分配中,若所有全局数据有且只有一份,他们被分割成若干片段,每个片段被分配在一个特定的场地上,则该策略属于( B):
A:集中式 B:分割式
C:全复制式 D:混合式
例2:现有一个具有多个分店的大型连锁超市,该连锁超市使用同一的连锁业务经营管理系统管理其日常业务。已知其中的销售数据明细表结构为(销售记录ID,商品ID,价格,数量,总金额,销售时间,分店ID),该表数据量很大。为了提高数据访问效率,系统将每年每个分店的销售数据划分成独立的数据表。这种划分方式称为( D )。
A:轮转划分 B:范围划分
C:散列划分 D:多维划分
第十四章 数据仓库与数据挖掘
1,数据仓库是一个面向主题,集成的,时变的,非易失的数据集合,支持管理部门的决策过程,数据仓库通过数据转移从多个数据源提取数据,为了解决不同数据源格式上的不统一,需要进行的数据操作是转换。
2,典型的数据体系结构包括:操作型数据,操作型存储,数据仓库,数据集市。
3,操作型数据存储ODS,根据数据源到ODS的更新频率,主要分成4类:
ODSI:秒级。
ODSII:小时级。
ODSIII:天级。
ODSIV:根据数据来源方向和类型来区分。提供一些报表和决策结果数据。
4,数据仓库中数据的维护策略一般可分为实时,延时,快照三种策略。
4,数据挖掘步骤:数据准备,数据挖掘,结果的解释评估。
5,根据OLAP数据的存储形式,OLAP的实现方式有基于多维数据库的OLAP和基于关系数据库的OLAP,混合型OLAP三种。
6,数据集成一般包括抽取,转换,清理,装载四项工作。
7,在多维分析中,如果将年销售额投影到每个月上来进行观察,这种分析动作被称为钻取。
8,在数据仓库中,元数据主要分为交换元数据和业务元数据。
9,在数据仓库环境中,粒度是一个重要的设计问题,粒度越小,细节程度越高,能回答的查询就越多,数据量就比较大。
10,在机器学习中,分类算法需要用到的样本数据一般分成训练集、测试集、验证集3类。
本章主要题型为选择和填空,常考的内容有数据仓库的概念,数据挖掘相关知识点:
例如:
例1:某网上书店根据用户的历史购书记录,采用某种挖掘算法分析出用户最可能属于某一类书的爱好者,应该采用(B)
A:关联分析 B:分类分析
C:时间序列分析 D:回归分析
例2:云计算是一种商业计算模型,包含互联网上的应用服务及在数据中心提供这些服务的软硬件设施,其中Paas指(B)
A:产品即服务 B:平台即服务
C:人员即服务 D:生产即服务**