之前看过一个面试题目,说数据仓库有什么优点?
我觉得可以换一个说法,数据仓库能够实现些什么内容。
在研读Ralph Kimall先生的数据仓库工具书(第3版)时,开篇就有提及到数据仓库与商业智能(DW/BI)系统的基本目标。书中抛出一下几个话题:
- 我们收集了海量的数据,但无法访问
- 业务人员需要方便地获取数据
- 我们需要以各种方式方便地对数据进行切片和切块
- 将最重要的事情展示给我
- 开会总是在争论谁的数据是正确的,而不是制定策略
- 希望决策的制定可以有更多的信息支持
基于上述的话题转化为业务需求,也就是说数据仓库可以做什么:
- 能够方便地存取信息。这里书中使用的字眼是信息,因为对于业务用户来说,数据需要有直观性,数据的结构与标识一定要符合业务用户思维过程和词汇,能够让业务用户通过数据直观了解到所需信息。同时访问数据的工具和应该要简单易用,并能在短时间内反馈结果给用户。
- 使用一致的形式展示信息。数据仓库的数据必须是可信的,一致性意味着数据仓库系统的内容的公共标志和定义,可以在不同的数据源之间公用。
- 能够适应变化。用户需求、业务环境、数据与技术都容易发生变化,设计时要考虑能够方便地处理无法避免的变化,以便在变化时仍能处理现有的数据和应用。
- 能够及时展示信息。数据仓库系统主要用于操作型决策,原始数据需要在用户期待的时间内转化为可用的信息。
- 能够保护信息安全。数据仓库必须能有效控制对组织中机密信息的访问,不然信息被盗,损失巨大。
- 数据仓库提高决策制定能力的权威和可信的基础。数据仓库最重要的输出是基于分析数据所产生的决策,这些决策体现了数据仓库的影响和价值,早期数据仓库系统的名称就是决策支持系统(Decision Support System,DSS)
- 成功的标识是业务群体接受并使用数据仓库。业务群体如果不用起来的话,这样数据仓库就难言成功了,毕竟数据仓库是可选的,当业务人员发现这边数据仓库能够快速简单地满足要求,这样的数据仓库才能发挥真正的价值。
自身的一些思考:
上面所讲的内容其实是成功的数据仓库能够实现的内容,那如果都能够实现的话,这些都是它的优点。但是如果有没有实现的点的话,那也是数据仓库的缺点。简单的例子就是安全性,如果做不到安全访问控制的话,这样的数仓将会对企业带来灾难。