如果我们将企业的客户按照下单频次和客单价两个维度切分成四个象限,划分为A、B、C、D、E五个群体,企业的核心诉求之一,便是找到更多的潜在客户群体A,转化为客户群体B,并努力使客户群体B向客户群体E转移,尽量留在E的位置。…
分类:数据挖掘
特征值与特征向量的几何含义(转)
全文转自blog:http://blog.csdn.net/lfkupc/article/details/4561564 长时间以来一直不了解矩阵的特征值和特征向量到底有何意义(估计很多兄弟有同样感受)。知道它的数学公式…
Adaboost Algorithm Step
Adaboost Algorithm Step 给定一个数据集: $$ D=\{(x^{(1)}, y^{(1)}), (x^{(2)}, y^{(2)}) … (x^{(n)}, y^{(n)})\} $$ 并为数…
数据科学之大数据知识体系大全
一 浅谈数据科学 数据科学(Data Science)这一概念自大数据崛起也随之成为数据领域的讨论热点,从去年开始,“数据科学家”便成为了一个工作职位出现在各种招聘信息上。那么究竟什么是数据科学?大数据和数据科学又是什么…
python遗传算法(GA)DEAP-Overview学习摘要
DEAP-Overview DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 一. T…
Python多版本切换工具-Pyenv\virtualenv及Anaconda科学计算环境的配置
为了安装Anaconda科学计算环境,控制好python版本,今天上午总算折腾好了。 学习python有时希望在python2.7环境下,有时希望在python3.4环境下,该怎么办呢? Anconda的包也不知道适合在…
机器学习与数据挖掘: 基础概念
如何成为机器学习工程师https://keras-cn.readthedocs….http://www.tensorfly.cn/tfdoc… 机器学习 vs 数据分析 数据特点 数据分析 机…
Apriori算法核心逻辑代码实现
概述Apriori算法是生成频繁集的一种算法。Apriori原理有个重要假设,如果某个项集是频繁的,那么它的所有子集势必也是频繁的。如果一个项集是非频繁项集,那么它所对应的超集就全都是非频繁项集。 实现 从大规模数据集中…
数据挖掘(三):数据预处理
在现实生活中,我们会遇到各种各样的数据,而且其中绝大多数的数据是“有毛病”的,不利于后期进行分析,所以我们在分析前需要进行数据的预处理。 3.1 数据预处理:概述 3.1.1 数据质量 数据质量包括准确性、完整性、一致性…
最全!2019数据分析与商业智能趋势前瞻
图片描述 本篇文章汇总了国外2018年商业智能领域多份权威报告,将普遍受到认同的核心观点进行梳理,包含AI、移动BI、自助式BI、云部署、数据治理、增强型BI等多个方向,力求为读者呈现清晰的2019年商业智能蓝图。 20…
数据挖掘的TO-DO-LIST
数据挖掘的流程与方法 1.任务: 关联分析 聚类分析 分类分析 异常分析 特异组群分析 演变分析 2.方法: 统计 在线处理分析 情报检索 机器学习 分类 实际应用: 应用分类/趋势预测/推荐关联类商品 回归分析 实际应…
穿越科研历史长河 荒漠之上负重前行
穿越科研历史长河 荒漠之上负重前行