大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师。欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦。 如果你是一名数据分析师,要让…
标签:机器学习
文本分类中的降维方法总结
引言 人们通常采用向量空间模型来描述文本向量,但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维,那么这个向量的维度将是非常的大。 这种未经处理的文本矢量不仅给后续工作带来巨大的计算开销,使整个处理…
KNN算法优缺点、原理及参数最优解
文章目录 1. KNN算法简介 1.1 简述 1.2 优缺点 1.3 适用数据范围 2. 工作原理 2.1 训练样本集 2.2 电影类别的KNN分析 如何进行电影分类 在这里插入图片描述 2.3 欧几里得距离(Eucli…
主成分分析(PCA)原理详解
“微信公众号” 本文同步更新在我的微信公众号里,地址:https://mp.weixin.qq.com/s/Xt1vLQfB20rTmtLjiLsmww 本文同步更新在我的知乎专栏里面: 主成分分析(PCA)原理详解 &…
机器学习:神经网络的模型构建
什么是神经网络 神经网络是一种模拟人脑工作原理,从而实现类人工智能的机器学习技术,支持处理图像、文本、语音以及序列多种类型的数据,可以实现分类、回归和预测等。 简单的神经元:逻辑单元(Logistic Unit) 由于神…
多元线性回归及虚拟变量(哑变量)设置
1.多元线性回归SPSS分析 四步搞定SPSS多元线性回归视频教程(含详细操作及结果解读)_哔哩哔哩_bilibili订阅陈老师B站送福利!订阅后加陈老师QQ1622275006送数据分析教程及软件福利哟~关注微信公众号…
SVM实现多分类常用的两种方法以及一对一法的代码(VS13+opencv3.4)
SVM实现多分类常用的两种方法以及一对一法的代码(VS13+opencv3.4) SVM是一个二值分类器,处理多分类问题的时候需要构造合适的多类分类器。 (1)直接法,直接在目标函数上进行修改,将多个分类面的参数求解合并…
做数据分析为何要学统计学(2)——集中趋势和离散趋势
给定一组数据,我们怎么来判断业务的基本情况呢?此时我们主要用到两个统计学工具:集中趋势和离散趋势。 1. 集中趋势 集中趋势是一组数据的代表值,那用什么值作代表最有代表性呢?当然这个值应该和所有值差距不大是最好,此时我们…
机器学习中,从一张图片中提取出感兴趣的区域(以交通标志为例)
在进行机器学习中,不管是用Haar特征,或者是Hog特征,最后进行的不论是adaboost分类,还是svm分类,都只能是检测出待检测的正样本相近的图片。 比如,为了提高准确性,我们在进行正样本的训练时,必须把正样本置于整…
详解 n 维向量、n 维数组 和 矩阵的维度
1. 概述 在机器学习过程中,我们会经常遇到向量、数组和矩阵这三种数据结构,下面就这三种数据结构做一次详细的分析。 同时我们时常困惑于维度,n维向量,n维数组,矩阵的维度,本文着重就这一方面进行分析。 2. 向量、数组和…
xgBoost的优缺点
Boosting是一种常用的统计学习方法,在训练过程中,通过改变训练样本的权重,学习多个分类器,最终获得最优分类器。在每一轮训练结束之后,降低被正确分类的训练样本权重,增大分类错误的样本权重,多次训练之后,一些被错误分类…
使用TensorFlow v2.0构建卷积神经网络
使用TensorFlow v2.0构建卷积神经网络。 这个例子使用低级方法来更好地理解构建卷积神经网络和训练过程背后的所有机制。 CNN 概述 MNIST 数据集概述 此示例使用手写数字的MNIST数据集。该数据集包含6…