3.4 解决样本类别分布不均衡的问题 转载:http://www.dataivy.cn/blog/3-4-%E8%A7%A3%E5%86%B3%E6%A0%B7%E6%9C%AC%E7%B1%BB%E5%88%AB%E5…
标签:机器学习
无理数平方根计算_如何找到数字的平方根并手动计算
无理数平方根计算 At times, in everyday situations, we may face the task of having to figure the square root of a numbe…
聚类算法之层次聚类
一、原型聚类和层次聚类 原型聚类也称基于原型的聚类(prototype-based clustering),这类算法假设聚类结构能够通过一组原型刻画,先对原型进行初始化,然后对原型进行迭代更新求解。采用不同的原型表示、不…
机器学习笔记笔记之三——文本类型处理-词袋法、TF-IDF理解
在面对文本型特征时,大致可以分为两种。 一是枚举类型,比如:男女,小学生初中生高中生大学生……这种类型下类别一般不会超过百种,那么就可以使用 哑编码(one-hot)来处理。 &n…
机器学习,基于labelme的图像训练样本制作
使用监督学习对图像进行分割操作时,尤其是在做项目时,往往现有的数据集不能满足要求。这时候需要 我们人工进行训练样本的制作。这里推荐的一个软件是labelme。 1、安装:sudo pip3 install label…
推荐书单(网课)-人生/编程/Python/机器学习
目录 一、在读 二、将读 三、已读 非专业书单 四、已读 专业书单 五、已看网课 六、在看网课 一个人如果抱着义务的意识去读书,便不了解读书的艺术。——林语堂《生活的艺术》 整理了下大学以来读过的书单,此举是为了督促自己…
学习笔记TF059:自然语言处理、智能聊天机器人
自然语言处理,语音处理、文本处理。语音识别(speech recognition),让计算机能够“听懂”人类语音,语音的文字信息“提取”。 日本富国生命保险公司花170万美元安装人工智能系统,客户语言转换文本,分析词正面…
MNIST机器学习数据集
介绍 在学习机器学习的时候,首当其冲的就是准备一份通用的数据集,方便与其他的算法进行比较。在这里,我写了一个用于加载MNIST数据集的方法,并将其进行封装,主要用于将MNIST数据集转换成numpy.array()格式的…
机器学习---最小二乘线性回归模型的5个基本假设(Machine Learning Least Squares Linear Regression Assumptions)
在之前的文章《机器学习—线性回归(Machine Learning Linear Regression)》中说到,使用最小二乘回归模型需要满足一些假设条件。但是这些假设条件却往往是人们容易忽略的地方。如果不考…
python机器学习_(1)鸢尾花的分类
鸢尾花的分类是python机器学习中比较经典的一个入门式教学课程,属于监督学习算法包括四个方面,训练,测试,评估,预测此次记录也适合从这四个方面出发一:训练利用已知的鸢尾花数据构建机器学习模型,用于预测新测量的鸢尾花的品…
TensorFlow端到端旋风教程
因为目前正在给师兄做一个设备异常检测的项目,开始有机会接触到TF。这篇教程既可以说是这段时间以来的笔记,同时也希望给项目组的其他小伙伴或后来者提供一个快速上手的索引。 所谓“端到端(End-to-End)”,指的是从环境…
学习笔记DL004:标量、向量、矩阵、张量,矩阵、向量相乘,单位矩阵、逆矩阵
线性代数,面向连续数学,非离散数学。《The Matrix Cookbook》,Petersen and Pedersen,2006。Shilov(1977)。 标量、向量、矩阵、张量。 标量(scalar)。一个标量,…