久仰Bishop的大作“Pattern Recognition and Machine Learning”已久,在我的硬盘里已经驻扎一年有余,怎奈惧其页数浩瀚,始终未敢入手。近日看文献,屡屡引用之。不得不再翻出来准备细读…
分类:机器学习
机器学习面试题准备
数据处理:如何处理缺失数据(missing value)? 各种处理方法有什么利弊?数据处理:如何将描述变量(categorical variables)转为连续变量(continuous variables)?如何处理…
机器学习路径
学习路径: 1. 有 Ng的课程 (推荐斯坦福的CS229,http://cs229.stanford.edu/materials.html)、林轩田在coursera上的两个课程、凸优化、矩阵分析相关的课程,就算入门了…
学习笔记CB008:词义消歧、有监督、无监督、语义角色标注、信息检索、TF-IDF、隐含语义索引模型
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。 …
python机器学习工具包scikit-learn
scikit-learn这个非常强大的python机器学习工具包 http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html S1. 导入数…
Read Caffe Program1 : layer_factory.hpp
我们来分析一下Caffe中的源程序,来探究一下深度学习的奥秘。作为一个菜鸡程序员,我表示压力有点大! /** * @brief A layer factory that allows one to register la…
学习笔记DL006:特征分解,奇异值分解
特征分解。 整数分解质因素。 特征分解(eigendecomposition),使用最广,矩阵分解一组特征向量、特征值。方阵?的特征向量(eigenvector),与?相乘相当对该向量缩放非零向量?,??=λ?。标量λ为…
8. Q语言学习之路—表
0. 概述 表(Tables)和列表、字典一样,都是q语言中的第一类对象(First-class entity) Q表是*列导向的* Q表是从字典构建的 1.表的定义 1. 表作为列字典 q)dc:`name`iq!(`…
有关机器学习/深度学习中的英语词汇
machine learning : 机器学习 deep learning : 深度学习 image processing : 图像处理 natural language processing :…
Python—numpy.bincount()
1、它大致说bin的数量比x中的最大值大1,每个bin给出了它的索引值在x中出现的次数。下面,我举个例子让大家更好的理解一下: # 我们可以看到x中最大的数为7,因此bin的数量为8,那么它的索引值为0->7 x …
统计机器学习(目录)
第一篇 优化算法 001 梯度下降(GradientDescent)小结 002 最小二乘法小结 第二篇 模型优化参数 003 交叉验证(CrossValidation)原理小结 004 精确率与召回率,RoC曲线与PR…
机器学习笔记笔记之三——文本类型处理-词袋法、TF-IDF理解
在面对文本型特征时,大致可以分为两种。 一是枚举类型,比如:男女,小学生初中生高中生大学生……这种类型下类别一般不会超过百种,那么就可以使用 哑编码(one-hot)来处理。 &n…