文章目录 频数表与列联表的生成 一维频数表 二维列联表 多维列联表 独立性检验 χ 2 \chi^2 χ2检验 相对危险度 (relative risk, RR)与比值比 (odds ratio, OR) 分层情形下的独…
分类:R
R语言中 在有重复的数据中只保留时间最大的一条数据
在有重复的数据中只保留时间最大的一条数据 1. 选出目标字段有重复的数据 2. 在重复的数据行中选出时间最大的数据 完整代码 1. 选出目标字段有重复的数据 这里介绍两种方法: 通过dplyr包,根据目标字段(key_n…
R语言修改下载安装包install.package的默认存储位置
https://blog.csdn.net/sinat_35187039/article/details/80239668
用初等行变换求矩阵的逆
高等代数的理论知识 (A | E) 经过初等行变换(E | A-1)(A-1 代表A的逆) matrix_inv <- function(A) { A_zhi <- Matrix::rankMatrix(A)…
R语言笔记-数值型变量的描述统计
文章目录 不分亚组的描述统计 使用向量操作计算单个变量的描述统计量 计算汇总了多个变量的数据框的描述统计量:“sapply()“ “psych“包:“descr…
R语言中ggplot2绘制——随心所欲修改横纵坐标!!!
1、首先绘制一个自带的数据散点图: install.packages("ggplot2")#安装ggplot2包 library("ggplot2")#加载该包 ggplot(iris,aes(Sepal.Length,…
R语言笔记-连续型变量组间差异比较
文章目录 独立样本t检验 方差齐性检验 (两组):“var.test()“ 独立样本t检验:“t.test()“ 非独立样本t检验 单因素方差分析 (ANOVA) 正态性检…
R语言设置数值输出(保留至小数点后位数和保留有效数字)
文章目录 1 options(digits)函数 2 round(x, n)函数 3 signif(y, n)函数 4 sprintf(fmt, …)函数 在R语言中,数字的输出默认为7位: > a =…
linux去掉windows下文件中的\r
Unix体系里,每行结尾只有“<换行>”,即“\n”;Windows体系里面,每行结尾是“<换行><回 车>”,即“\n\r”。一个直接结果是,Unix体系下的文件在Windows里打…
[原] Python 开发者面向文档编程的正确姿势
概述 秦人不暇自哀,而后人哀之;后人哀之而不鉴之,亦使后人而复哀后人也! –论面向文档编程的重要性 如果想看见识一个人写代码的功力,注释其实是区分老司机和小鲜肉的一个显著的分界线(有没有观察到你们公司的领导基…
机器学习:随机森林学习笔记
前言 随机森林是一个很强大的模型,由一组决策树投票得到最后的结果。要研究清楚随机森林,首先需要研究清楚决策树,然后理解随机森林如何通过多棵树的集成提高模型效果。 本文的目的是将自己学习这个模型时有用的资料汇总在一起。 决…
[译] 解密 Uber 数据部门的数据可视化最佳实践
概述 在2015年初,我们在Uber规划了一个官方的数据科学团队。这个主意的缘起是:通过可视化数据探索工具从Uber的数据中发现洞见。每天,Uber 管理上亿级别的GPS位置信息。每分钟,我们的平台处理上百万的移动事件。…