最近在用R ,需要按一个比较老的工具包,只有这个工具包的.tar.gz 包。 就从https://blog.csdn.net/qq_28227523/article/details/51996178https…
分类:R
R包安装失败,选择镜像失败 :Error in file: 无法打开链结问题解决
解决方法 1.点击 帮助 2.点击 CRAN主页 3. 如果能够打开IE浏览器,会出现R的安装信息,安装包的信息,这时选择一个镜像,之后重新在R运行窗口下载R包,或者点击Packages 找到要安装的R包进行下载。 4.…
R语言ggplot画条形图按照想要的顺序排列
加载所需要的包 library(ggplot2) library(dplyr) 创建数据集 Year <- c(rep("2012" , 3) , rep("2013" , 3) , rep("2014" , 3)…
ggplot2画图坐标轴数字设置不显示科学计数法
有时候看着R坐标轴的数字挺刺眼的,科学计数法的表示形式真让人难过,解决方法也是很简单的,如下设置就ok了! options(scipen=200)
R语言笔记-分类变量列联表和独立性检验
文章目录 频数表与列联表的生成 一维频数表 二维列联表 多维列联表 独立性检验 χ 2 \chi^2 χ2检验 相对危险度 (relative risk, RR)与比值比 (odds ratio, OR) 分层情形下的独…
R语言笔记-数值型变量的描述统计
文章目录 不分亚组的描述统计 使用向量操作计算单个变量的描述统计量 计算汇总了多个变量的数据框的描述统计量:“sapply()“ “psych“包:“descr…
linux去掉windows下文件中的\r
Unix体系里,每行结尾只有“<换行>”,即“\n”;Windows体系里面,每行结尾是“<换行><回 车>”,即“\n\r”。一个直接结果是,Unix体系下的文件在Windows里打…
[原] Python 开发者面向文档编程的正确姿势
概述 秦人不暇自哀,而后人哀之;后人哀之而不鉴之,亦使后人而复哀后人也! –论面向文档编程的重要性 如果想看见识一个人写代码的功力,注释其实是区分老司机和小鲜肉的一个显著的分界线(有没有观察到你们公司的领导基…
机器学习:随机森林学习笔记
前言 随机森林是一个很强大的模型,由一组决策树投票得到最后的结果。要研究清楚随机森林,首先需要研究清楚决策树,然后理解随机森林如何通过多棵树的集成提高模型效果。 本文的目的是将自己学习这个模型时有用的资料汇总在一起。 决…
[译] 解密 Uber 数据部门的数据可视化最佳实践
概述 在2015年初,我们在Uber规划了一个官方的数据科学团队。这个主意的缘起是:通过可视化数据探索工具从Uber的数据中发现洞见。每天,Uber 管理上亿级别的GPS位置信息。每分钟,我们的平台处理上百万的移动事件。…
[译] 解密 Airbnb 的数据科学部门如何构建知识仓库
顽疾 Airbnb的数据团队很重要的一个职责就是传播基于数据的决策方法。我们将数据的获取民主化,使得每一个Airbnb的成员都可以量化他们基于数据的决策影响力并且借此洞察用户偏好,提升数据产品的用户体验。最近,我们开始解…
[原]深入对比数据科学工具箱:Python和R之争[2016版]
概述 在真实的数据科学世界里,我们会有两个极端,一个是业务,一个是工程。偏向业务的数据科学被称为数据分析(Data Analysis),也就是A型数据科学。偏向工程的数据科学被称为数据构建(Data Building),…