作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 学数据分析当然要先有数据,数据是分析的根本,不然一切都是空谈。如果是在公司里,得到数据轻而易举,因为公司有客户,有业务,必然会产生大量数…
分类:数据挖掘
【数据科学系统学习】数据科学在做什么 # 描述性统计分析
博主在一开始学习数据科学时,没有人带路,没有一条直接的路径。因此各种信息都接收,一开始比较混乱,后来接触的多了,渐渐开始了解到关于数据科学无非分为数学中的统计学、计算机中的 python 和机器学习算法、项目中对业务的理…
【数据科学系统学习】数据科学在做什么 # 专题概述
博主在一开始学习数据科学时,没有人带路,没有一条直接的路径。因此各种信息都接收,一开始比较混乱,后来接触的多了,渐渐开始了解到关于数据科学无非分为数学中的统计学、计算机中的 python 和机器学习算法、项目中对业务的理…
【Python数据分析基础】: 异常值检测和处理
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 上一篇分享了关于数据缺失值处理的一些方法,链接如下:【Python数据分析基础】: 数据缺失值处理 本篇继续分享数据清洗中的另一个常见问…
用户行为与生存分析
生存分析的来历 生存分析(Survival Analysis)来源于基础医学领域,最早用来研究各种治疗方案对病人寿命的影响。而寿命则用一个end event(死亡)的方式衡量。基本定义如下: T为标记事件发生的时间。 生…
听说你想来做人工智能了
达观数据招人啦! 面向北京、上海、深圳、成都四个地区 提供人工智能、算法、产品、销售等多类岗位 毕业多年,你的状态还好吗? 是否忧虑被甩在时代的边缘? 是否担心被机器取代? 是否不安现状、跃跃欲试? 来吧, 选择对的行业…
【Kaggle入门级竞赛top5%排名经验分享】— 建模篇
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 前情回顾 上一篇是数据挖掘的前戏,主要目的是认识数据特征、判断特征重要性、观察数据异常,掌握数据间联系。本篇将继续上一篇分析进行数据挖掘…
3天破9亿!上万条评论解读《西虹市首富》是否值得一看
作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据. 个人公众号:数据森麟(ID:shujusenlin),知乎同名专栏作者…
【Kaggle入门级竞赛top5%排名经验分享】— 分析篇
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 Kaggle作为公认的数据挖掘竞赛平台,有很多公开的优秀项目,而其中作为初学者入门的一个好的项目就是:泰坦尼克号生还者预测。 可能这个项…
数据挖掘实战项目——北京二手房房价分析
本次实战项目的主要目的是分析北京二手房房价,项目源自博文:入门Python数据分析最好的实战项目(一)和入门Python数据分析最好的实战项目(二)。本篇文章仅记录博主在学习过程中的思路。 数据分析 首先我们要对数据进行…
Spark数据分析概念入门
原文地址: http://blog.52sox.com/Spark-d… 在大数据的时代,数据的各种术语层出不穷,比如数据仓库、数据湖,还有比较热门的Hadoop、Spark,让人眼花缭乱。在这里,我们主要介…
入门Python数据分析最好的实战项目(二)
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 上一篇和大家分享了一个入门数据分析的一个小项目 北京二手房房价分析,链接如下: 入门Python数据分析最好的实战项目(一) 文章在sf…