目录 一、基础知识 二、回归系数与相关系数 1.定义 2.二者的联系 3.二者的区别 假设有两个随机变量 ( x , y ) (x,y) (x,y),其 N N N个样本组合为 ( x 1 , x 2 , … , x N…
标签:统计学
数据的描述性统计_数据的集中趋势描述
数据的描述性统计 1. 数据的集中趋势描述 1.1 算术平均值 1.1.1 简单算术平均值 1.1.2 加权算术平均值 1.1.3 算术平均值的利与弊 1.2 几何平均值 1.3 众数 1.4 中位数 数据分析的对象主要…
统计学简介之十三——两个总体参数的检验
统计学简介之十三——两个总体参数的检验 一、检验统计量的确定 二、两个总体均值之差的检验 三、两个总体比例之差的检验 四、两个总体方差比的检验
高维数据中特征筛选方法的思考总结——多变量分析筛选法
前言:之前的文章(高维数据中特征筛选方法的思考总结——单变量分析筛选法)中,对单变量分析筛选变量进行了初步考量,本文将进一步总结多变量分析筛选法。由于本文多处摘录网上的博客,只是进行了归纳整理,因此笔者将本文定性为转载类…
模型中各变量对模型的解释程度
在建立一个模型后,我们会关心这个模型对于因变量的解释程度,甚至想知道各个自变量分别对模型的贡献有多少。对于非线性模型,如 Random Forest 和 XGBoost 等由于其建模过程就是筛选变量的过程,可以计算变量的…
面板数据,面板数据的三种基本模型
转载于:https://blog.csdn.net/weixin_41725746/article/details/80545142。仅用于学习之用,如有侵权,请联系我。
将非高斯分布数据转换为高斯分布数据
高斯分布是一个很神奇的分布,很多人在考虑问题的时候,总是很喜欢假设数据是满足高斯分布的。其原因可能就是,正态分布的各项统计学特征都可以很好地表示出来,我们只需要知道两个参数——均值和方差,即可,就可以得到概率密度分布、累…
程序代码行数统计
程序写完了,提交著作权的时候不知道代码行数是多少怎么办? 介绍 软件名称 兼容系统 下载地址 代码统计工具 Windows 软件下载 下面我们开始教程 打开主应用程序 点击加号添加程序项目所在的目录 点击按钮选择需要统计…
抽样和抽样分布-样本均值的抽样分布
抽样分布: 现在,假设将抽取n个样本组成一个简单随机样本的过程重复进行下去,每次都计算 x¯ 和 p¯ 的值。 在不同的简单随机样本中,这些样本统计量的值有各种可能的结果,它们是随机变量。是随机变量就能得到其概率分布,我…
多元线性回归哑变量设置方法
多元线性回归是研究一个连续型变量和其他多个变量间线性关系的统计学分析方法,如果在自变量中存在分类变量,如果直接将分类变量和连续性变量统一纳入模型进行分析是有问题的,尤其是无序分类资料,即使进入了模型,也难以解释,因此分类…
数据的描述性统计_数据的集中趋势描述
数据的描述性统计 1. 数据的集中趋势描述 1.1 算术平均值 1.1.1 简单算术平均值 1.1.2 加权算术平均值 1.1.3 算术平均值的利与弊 1.2 几何平均值 1.3 众数 1.4 中位数 数据分析的对象主要…
《统计学》学习笔记之数据的图表展示
鄙人学习笔记 文章目录 数据的预处理 品质数据的整理与展示 分类数据的整理与图示 顺序数据的整理与图示 数值型数据的整理与展示 数据的预处理 数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、…