接触BI时间不是很长,但是对于报表的认识可以说是从入行起就经常听说。像我们对于表表的认识,大多数就是类似于Excel表格一样,做出的各种列表式数据展示。做的更好一点的如在页面中增加一些图表,增加报表的可读性。 近几年,对…
分类:数据挖掘
数据挖掘:特征工程——特征提取与选择
数据挖掘:特征工程——特征提取与选择 特征的处理和构建已经在上一篇特征处理和构建文章中有所总结。接来下对特征提取和选择进行说明。 注:特征提取的范围很大,一般理解的话,它提取的对象是原始数据,目的就是自动地构建新的特征,…
数据挖掘-序列模式挖掘-基础知识和概念总结(sequential pattern mining)
一:基础概念介绍 序列模式挖掘:指挖掘相对时间或其他模式出现频率高的模式 序列模式挖掘的动机:大型连锁超市的交易数据有一系列的用户事物数据库。每一条记录包括用户的ID,事物发生的时间和事物涉及的项目。如果能够在其中挖掘涉…
20+网页采集工具—5分钟提取线上数据
原文章请查看:20+网页采集工具—5分钟提取线上数据 网页爬虫(也称为数据提取,数据采集,数据爬虫)如今已广泛应用于许多领域。在没有网络爬虫工具出现之前,对于没有编程技能的普通人来说,它是一个神奇的词,它的高门槛不断将人…
股票数据可视化
本文通过对股票数据进行可视化数据分析。(tushare ID:452043) tushare介绍 数据爬取 数据可视化分析 3.1. 近三年的走势 3.2. 股票点数的最大值区间 3.3. 每日低点分析 3.4. 高低点…
数据挖掘概念与技术(第三版)课后答案——第五章
未完待续。。。 5.1 假定10维基本方体只包含3个基本单元: (1) (a1,d2,d3,d4,…,d9,d10), (2) (d1,b2,d3,d4,…,d9,d10), 和(3) (d1,d…
数据挖掘导论复习
文章目录 第1章 认识数据挖掘 1、数据挖掘的定义 2、有指导学习和无指导学习 3、数据挖掘的过程 4、数据挖掘的作用 5、数据挖掘技术 第2章 基本数据挖掘技术 1、决策树概念和C4.5算法的一般过程 2、决策树关键技…
数据挖掘概念与技术(第三版)课后答案——第一章
1.1 什么是数据挖掘?在你的回答中,强调以下问题: (a)它是又一种广告宣传吗? (b)它是一种从数据库、统计学、机器学习和模式识别发展而来的技术的简单转换或应用吗? (c)我们提出了一种观点,说数据挖掘是数据库技术进…
广告点击率预估是怎么回事?
原文地址 点击率预估是广告技术的核心算法之一,它是很多广告算法工程师喜爱的战场。一直想介绍一下点击率预估,但是涉及公式和模型理论太多,怕说不清楚,读者也不明白。所以,这段时间花了一些时间整理点击率预估的知识,希望在尽量不…
支持向量机基本原理与思想
一、支持向量机: SVM 即支持向量机(Support Vector Machine), 是有监督学习算法的一种,用于解决数据挖掘或模式 识别领域中数据分类问题。 二、基本原理: SVM 算法即寻找一个分类器使得超平面和…
关于点击率模型,你知道这三点就够
关于点击率模型,你知道这三点就够 说到广告,或者运营,关注的最多的就是点击率了。我们经常能听说某某科学家通过建立更好的点击率预测模型,为公司带来上亿的增量收入。点击率这么简单直接的统计量,为什么要用复杂的数学模型来刻画呢…
决策树系列(四)——基于决策树算法实现员工离职率预测
文章目录 基于决策树算法实现员工离职率预测 一、引入工具包 二、数据加载 三、数据预处理 3.1 重复值处理 3.2 缺失值处理 3.3 异常值处理 四、特征选择 4.1 删除明显无关特征 4.2 查看数值型特征相关性 …