最近在学习python著名的绘图包matplotlib时发现,有时候图例等设置无法正常显示中文,于是就想把这个问题解决了。 PS:本文仅针对Windows,其他平台仅供参考。 原因 大致就是matplotlib库中没有中…
标签:数据分析
Python 和 R 数据分析/挖掘工具互查
写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大家索引),请大家如果有需要收藏到书签中。 如果大家还知道哪些常用的命令,…
Numpy 中文用户指南 3.2 创建数组
原文:Array creation 译者:飞龙 另见 数组创建例程 导言 数组创建的一般机制有五种: 从其它Python的结构转换(如列表和元组) 内置的NumPy数组创建对象(如 arange, on…
Numpy 中文用户指南 2. 快速启动
原文:Quickstart tutorial 译者:Reverland 来源:试验性NumPy教程(译) 2.1 先决条件 在阅读这个教程之前,你多少需要知道点python。如果你想重新回忆下,请看看Python Tut…
0x01 念念Python,必有回响
摘要:灵蛇出现,必有异像,Python最热的领域,估计非数据分析、挖掘领域莫属了。以Scikit-Learn为代表的数据分析领域,从这里开始,便是Python的天下;一边操作实例,一边阅读文档,再辅助以相关的理论基础,持…
Python数据分析入门之pandas总结基础(二)
一.大熊猫世界来去自如:Pandas的I/O 老生常谈,从基础来看,我们仍然关心pandas对于与外部数据是如何交互的。 1.1 结构化数据输入输出 read_csv与to_csv 是⼀对输⼊输出的⼯具,read_csv…
Python多版本切换工具-Pyenv\virtualenv及Anaconda科学计算环境的配置
为了安装Anaconda科学计算环境,控制好python版本,今天上午总算折腾好了。 学习python有时希望在python2.7环境下,有时希望在python3.4环境下,该怎么办呢? Anconda的包也不知道适合在…
99%的人都不知道的pandas骚操作(一)
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 pandas有一种功能非常强大的方法,它就是accessor,可以将它理解为一种属性接口,通过它可以获得额外的方法。其实这样说还是很笼统…
Kaggle入门级赛题:泰坦尼克号生还者预测——数据分析篇
本次分享的项目来自 Kaggle 的经典赛题:泰坦尼克号生还者预测。分为数据分析和数据挖掘两部分介绍。本篇为数据分析篇。 赛题解读 比赛概述 RMS 泰坦尼克号的沉没是历史上最为人熟知的海难事件之一。 1912 年 4 …
【数据科学系统学习】Python # 数据分析基本操作[二] pandas
我们在上一篇介绍了 NumPy,本篇介绍 pandas。 pandas入门 Pandas 是基于Numpy构建的,让以NumPy为中心的应用变的更加简单。 pandas的数据结构介绍 Series 由一组数据(各种 Nu…
【Python数据分析基础】: 异常值检测和处理
作者:xiaoyu 微信公众号:Python数据科学 知乎:python数据分析师 上一篇分享了关于数据缺失值处理的一些方法,链接如下:【Python数据分析基础】: 数据缺失值处理 本篇继续分享数据清洗中的另一个常见问…
用户行为与生存分析
生存分析的来历 生存分析(Survival Analysis)来源于基础医学领域,最早用来研究各种治疗方案对病人寿命的影响。而寿命则用一个end event(死亡)的方式衡量。基本定义如下: T为标记事件发生的时间。 生…