概念模型就是在了解了用户的需求,用户的业务领域工作情况以后,经过分析和总结,提炼出来的用以描述用户业务需求的一些概念的东西。如销售业务中的“客户”和“定单”,还有就是“商品”,“业务员”。 用US…
标签:数据仓库
DCMM28个能力域学习心得(数据退役能力等级深刻理解)
6、数据战略: 1、数据战略规划 概述:数据战略规划是在所有利益相关者之间达成共识的结果。 过程描述:识别利益相关者,明确利益相关者的需求;数据战略评估,数据战略制定{愿景陈述,规划范围,管理模型…} 过程目标:建立、维…
如何高效计算用户留存率
如何高效计算用户留存率 简单介绍留存率的概念,说明数仓建设中对留存率计算的优化思路 什么是留存率 在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。 留存率就是留存…
3.数据仓库之确定粒度
在数据仓库的开发过程中,确定数据仓库中的数据的粒度是至关重要的,翻阅了很多书籍,对粒度的描述都过于笼统,百度百科对数据粒度的定义: 数据粒度,是指数据仓库中数据的细化和综合程度。根据数据粒度细化标准:细化程度越高,粒度越…
13- 数据建模-建模方法三:实体建模
实体建模法并不是数据仓库建模中常见的一个方法,它来源于哲学的一个流派。 从哲学的意义上说,客观世界应该是可以细分的,客观世界应该可以分成由一个个实 体,以及实体与实体之间的关系组成。我们在数据仓库的建模过程中完全可以…
数据仓库优缺点
之前看过一个面试题目,说数据仓库有什么优点? 我觉得可以换一个说法,数据仓库能够实现些什么内容。 在研读Ralph Kimall先生的数据仓库工具书(第3版)时,开篇就有提及到数据仓库与商业智能(DW/BI)系统的基本目…
如何高效计算用户留存率
如何高效计算用户留存率 简单介绍留存率的概念,说明数仓建设中对留存率计算的优化思路 什么是留存率 在互联网行业中,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。 留存率就是留存…
数据仓库之父——Bill Inmon(转载)
比尔·恩门(Bill Inmon),被称为数据仓库之父,最早的数据仓库概念提出者,在数据库技术管理与数据库设计方面,拥有逾35年的经验。他是“企业信息工厂”的合作创始人与“政府信息工厂”的创始人。 比尔·恩门的思想与…
解读《Hadoop 构建数据仓库实践》
书中构建一个数据仓库示例模型的讲解,实实在在的从 0 到 1 讲述了一个基于big data 的数据仓库原型的搭建。可以看做是一个非典型的应用场景。里面有很多的点,是可以值得拿出来好好深入思考的,举一反三 在数据建模这块…
hive实战
1. 前言 作为数据仓库的工具,hive提供了两种ETL运行方式,分别是通过Hive 命令行和beeline客户端; 命令行方式即通过hive进入命令模式后通过执行不同的HQL命令得到对应的结果;相当于胖客户端模式,即客…
Hive学习笔记1
什么是Hive: Hive是基于Hadoop之上的数据仓库,数据存放在HDFS上,它同样可以通过ETL来进行数据的抽取、转换和加载。同时Hive可以自己开发Mapreduce程序来完成本身不能提供的数据处理操作。Hive…
【数据仓库】元数据血缘分析
现在数据仓库基本上采用Hadoop平台了,那么数据仓库里面元数据的血缘分析的思路有哪些呢 基本上有下面这两种思路: 1、解析hql脚本,通过正则表达式去匹配每一行字符串 2、采用Hadoop自带的语法分析类解析 这里比较…