1. 使用tapply函数 # INDEX相当于groupBy tapply(salarys$SALARY, INDEX=salarys$SEX, FUN=sum) 如果出现参数的长度不一致的错误,如下: Error i…
分类:R语言
R语言将数据框中的字符类型数字转换为数值
转载:https://blog.csdn.net/Candle_light/article/details/84374814 场景1 我现在有一个数据框datexpr,里面的数字都是以字符型表示的,像这样 > da…
R语言t检验
目录 一、概念 二、应用条件 三、分析流程 1、单样本t检验 2、两配t检验 3、两独立样本的t检验 一、概念 t检验又称Student’s t检验,是以t分布为基础的统计分析方法。是定量资料分析中最为常见的…
拓端tecdat|R语言中使用RCPP并行计算指数加权波动率
原文链接:http://tecdat.cn/?p=17829 原文出处:拓端数据部落公众号 指数加权波动率是一种波动率的度量,它使最近的观察结果有更高权重。我们将使用以下公式计算指数加权波动率: S [t] ^ 2 = …
R语言如何合并Excel多行的重复数据
我们现在有这样的数据,可以看到里面的Description有很多重复行,我们想把它合并成一行,并且把SYMBOL的基因列总结起来,使用dplyr包进行处理, 其中有两个函数,一个是group_by,用于选定重复数据, 另…
分类变量logistic回归分析--1
1. 二分类logistic回归分析 概念解释 logistic回归介绍: Logistic回归适用于二分类变量(0和1)。模型假设Y服从二项分布,线性模型的拟合形式为: l o g e ( π 1 − π ) = β …
R语言--合并指定列的两个表数据
A<-(read.csv("f:\\TEST\\TDD.csv")) B<-(read.csv("f:\\TEST\\ECI.csv")) data1<-data.frame(A[c('Date_ID'…
R语言-预测海藻数量2(获取预测模型,提高模型准确性)
获取预测模型 因为海藻数量基本是数值型数据,所以考虑进行回归分析(多元线性回归模型),一个变量和一组解释变量的关系 clean.algae <- knnImputation(algae,k = 10) >lm…
常用的关联规则算法(Apriori算法、FP-growth算法)的优缺点
Aprion算法的优缺点 优点: 1) Aprioi算法采用逐层搜索的迭代方法,算法简单明了,没有复杂的理论推导,也易于实现。 2) 数据采用水平组织方式 3)采用Apriori 优化方法 …
R语言差异检验:t检验
文章目录 @[toc] 单样本t检验 适用条件 具体计算公式 R语言示例 独立样本t检验 适用条件 具体计算公式 R语言示例 配对样本t检验 适用条件 具体计算公式 R语言示例 t检验(student t检验)是应用t分…
R语言 数据集某一列中不重复的数据以及其个数
R语言 数据集某一列中不重复的数据以及其个数 提取出某一列中不重复的数据 unique(data$Symbol) 不重复的数据个数(Symbol的个数) length(unique(totaldata$Symbol))
R语言将数据框中的字符类型数字转换为数值
转载:https://blog.csdn.net/Candle_light/article/details/84374814 场景1 我现在有一个数据框datexpr,里面的数字都是以字符型表示的,像这样 > da…