从今年四月份到现在已经工作快9个月了,最开始是做推荐系统,然后做机器学习,现在是文本挖掘,每个部分研究的时间都不多,但还是遇到了很多问题,目前就把一定要总结的问题总结一下,以后有时间多看看,提醒自己看有没有解决。 …
标签:机器学习
时序数据处理中DNN和RNN的区别
DNNV vs RNN 在实际处理时序数据的时候思考了这么一个问题(知乎上也有人问):为什么要用RNN,不能把时间序列的数据都作为特征值输入全连接神经网络(DNN)吗? 我看到知乎上有个回答不错: 如果固定了就是前四天输…
机器学习经典书籍
入门书单 《数学之美》 PDF 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言处理等领域的应用。 《Programming Collective Intelligence》(《集体智慧编程》)PDF…
机器学习——几种分类算法的汇总
机器学习——几种分类算法的汇总 参考博客:http://www.apachecn.org/map/179.html 参考博客写的很全面,也有例子,我这算是转载缩减记录方便自己记忆,有想参考的朋友可以参照原博客学习。 分类…
随机森林的优缺点
网上有很多关于随机森林优缺点的总结,但是都只是抄来抄去,并没有对这些优缺点作说明,导致有些看不懂。本人根据自己的理解,对某些优缺点做一下说明,如果理解有不对的地方,…
机器学习工具
机器学习工具 参考网站: https://www.zhihu.com/question/20472776(知乎:学习机器学习有哪些好工具推荐?) http://blog.csdn.net/myarrow/article/…
机器学习和统计学习的交锋
转载自:https://zhuanlan.zhihu.com/p/43360613 机器学习≠数据统计 「融资的时候, 我们讲人工智能 ;找工作的时候,我们说深度学习;但做项目的时候,我们讲 logistic 回归。」 …
机器学习,数据挖掘,统计学,云计算,众包(crowdsourcing),人工智能,降维(Dimension reduction)
机器学习 Machine Learning:提供数据分析的能力,机器学习是大数据时代必不可少的核心技术,道理很简单:收集、存储、传输、管理大数据的目的,是为了“利用”大数据,而如果没有机器学习技术分析数据,则“利用”就无…
机器学习笔记--Hoeffding霍夫丁不等式
Hoeffding霍夫丁不等式 在< >第八章”集成学习”部分, 考虑二分类问题 \(y \in \{-1, +1\}\) 和真实函数 \(f\), 假定基分类器的错误率为 \(\ep…
Decision Tree 决策树
决策树(decision tree)是一种基本的分类与回归方法。《统计机器学习》主要介绍了用于分类的决策树,《机器学习实战》主要介绍了回归树,两者结合能帮助很好地理解决策树。 在分类问题中,表示基于特征对实例进行分类的过…
学习笔记DL004:标量、向量、矩阵、张量,矩阵、向量相乘,单位矩阵、逆矩阵
线性代数,面向连续数学,非离散数学。《The Matrix Cookbook》,Petersen and Pedersen,2006。Shilov(1977)。 标量、向量、矩阵、张量。 标量(scalar)。一个标量,…
Cross Validation交叉验证
训练集 vs. 测试集 在模式识别(pattern recognition)与机器学习(machine learning)的相关研究中,经常会将数据集(dataset)分为训练集(training set)跟测试集(te…