在NG的ML课程中和西瓜书中都有提到:最佳的数据分类情况是把数据集分为三部分,分别为:训练集(train set),验证集(validation set)和测试集(t…
分类:机器学习
机器学习的 label 和 feature 的概念
摘录 reddit 链接上一段话The label is the name of some category. If you’re building a machine learning system to …
AI开发书籍分享
编程书籍的整理和收集 最近一直在学习deep learning深度学习和机器学习的东西,发现深入地去学习就需要不断的去提高自己算法和高数的能力然后也找了很多的书和文章,随着不断的学习,也整理了下自己的学习笔记准备分享出来…
特征处理之多项式扩展
概述: “数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已”。线性模型是在统计机器学习中常用的模型,我们假设解释变量和响应变量的关系是线性的。真实情况未必如此。如果想仿造一段曲线,那么首先应该保证曲线的起…
深度学习anchor的理解
摘抄与某乎 anchor 让网络学习到的是一种推断的能力。网络不会认为它拿到的这一小块 feature map 具有七十二变的能力,能同时从 9 种不同的 anchor 区域得到。拥有 anchor 的 r…
贝叶斯在机器学习中的应用(一)
 …
机器学习(六)—随机森林Random Forest
1、什么是随机采样? Bagging可以简单的理解为:放回抽样,多数表决(分类)或简单平均(回归); Bagging的弱学习器之间没有boosting那样的联系,不存在强依赖关系,基学习器之间属于并列生成。它的特…
机器学习系列:个人体会
机器学习(MachineLearning),在我看来就是让机器学习人思维的过程。机器学习的宗旨就是让机器学会“人识别事物的方法”,我们希望人从事物中了解到的东西和机器从事物中了解到的东西一样,这就是机器学习的过程。在机器…
机器学习——超参数搜索
基础概念 超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。通常情况下,在机器学习过程中需要对超参数进行优化,给学习器选择一组最优超参数,以提高学习的性能和效果。比如,树的数量或树的深度,学习率(多种…
机器学习算法分类
按学习方法分类 监督学习 有训练集(包含数据及其分类)及测试集(有数据没分类) 从二元分类(支持向量机)到多元分类 增强学习 机器学习的结果会有相应的奖励与惩罚 机器学习的目标就是将奖励最大化(类似运筹学) 无监督学习 …
机器学习中的正负样本
对于机器学习中的正负样本问题,之前思考过一次,但是后来又有些迷惑,又看了些网上的总结,记录在这里。 我们经常涉及到的任务有检测以及分类。 针对与分类问题,正样本则是我们想要正确分类出的类别所对应的样本,例如,我们要对一张…
用python写一个简单的推荐系统
前言 在上篇文章豆瓣电影,电视剧DM实战中提及到,我和室友们产生了剧荒,萌生出要做一个个人用的推荐系统,解决剧荒的问题的想法,经过一轮的死缠烂打,这个个人推荐系统终于成型了。 今天来分享一下心得,对此感兴趣的朋友可以自己…