简介 在商业应用中,时间是最重要的因素,能够提升成功率。然而绝大多数公司很难跟上时间的脚步。但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来。不要担心,本文并不会讨论时间机器,讨论的都是很实用的东西。 本文将…
标签:数据分析
数据分析工作到底在做什么
今天是2018年10月28日,仔细一算,已经工作两年多了,从16年7月毕业到现在一直都在做数据分析工作,总结一下这两年的工作历程和对数据分析工作的一些看法。 &nbs…
数据分析中缺失值的处理方法
1、缺失值的分类 按照数据缺失机制可分为: (1) 完全随机缺失(missing completely at random, MCAR) 所缺失的数据发生的概率既与已观察到的数据无关,也…
关于数据分析的几点心得:维度、指标、KPI
1、看数据看维度 在对某一项业务或者业务的某个模块进行分析时,可以从大小两个角度去切入分析。 首先站在广阔的视角去看待一些数据。比如对某个产品(消费品),就要分析在大环境下是一个什么样的数据,如市场排名,市场占有率。还要…
Excel里关于if的9个函数,如何指定条件求和、计数、平均等
总结了一下Excel里的求满足条件的计数、求和、平均值、最大值、最小值、标准差等9个方法。 01 countif 作用:对满足条件的区域统计个数 模板:countif(条件所在的区域,条件) …
Python 实现 计算相关系数 皮尔逊相关系数 Pearson、Spearman
数据探索 计算相关系数 为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系统来进行相关分析。 在二元变量的相关分析过程中比较常用的有Pearson相关系数,Spearman秩相关系数和判定系数。 皮尔逊相关系数…
计算相关系数 皮尔逊相关系数 Pearson、Spearman
数据探索 计算相关系数 为了更加准确地描述变量之间的线性相关程度,可以通过计算相关系统来进行相关分析。 在二元变量的相关分析过程中比较常用的有Pearson相关系数,Spearman秩相关系数和判定系数。 皮尔逊相关系数…
数据分析统计学基础之数据的趋势
数据的趋势 一.数据的集中趋势 集中趋势又称“数据的中心位置”、“集中量数”等。它是一组数据的代表值.数据的集中趋势就是一组数据向数据的中心值靠拢的程度。 集中趋势是统计学中的重要统计分析指标,常用的有平均数,中…
利用group by 计算分类占比:对比 sql 和 python
利用group by 计算分类占比:对比 sql 和 python 数据有col_1,col_2,col_3如下: sql SELECT A.*,ROUND(COL3/TOTAL1,2) AS RATIO FROM (S…
统计学之描述性统计(一)
统计学之描述性统计(一) 1、描述性统计分析 描述性统计分析主要是对所收集的数据进行分析,得出反映客观现象的各种数量特征的一种分析方法,它包括数据的集中趋势分析、数据离散程度分析、数据的频数分布分析等,描述性统计分析是对…
数据分析之数据预处理、分析建模、可视化
大纲 思维导图 1. 数据分析概述 1.1 简介 1.2 发展历程 1.3 应用领域 1.4 开发流程 2. 数据类型 2.1 结构化与非结构化数据 2.2 定性与定量数据 2.3 截面数据与时间序列数据 3. 数据来源…
Python读取csv文件的某一行
Python读取csv文件的某一行 reader函数 DictReader 站长用Python写了一个可以提取csv任一列的代码,欢迎使用。Github链接 csv是Comma-Separated Values的缩写,是…