shark版本 Shark3.0 boost版本 boost1.59(注:boost1.60把ice_not给取消了,会导致shark编译错误,所以使用boost1.59,也不知道现在这个错误修复了没有) 编译boost…
分类:机器学习
关于数据缺失问题的总结
作者:enova 摘自:《计算机科学论坛》造成数据缺失的原因 在各种实用的数据库中,属性值缺失的情况经常发全甚至是不可避免的。因此,在大多数情况下,信息系统是不完备的,或者说存在某种程度的不完备。造成数据缺失的原因是多方…
开源集锦
Android2017 这些技术 —— 你都了解过吗 插件化 热更新 对Android平台,我们通常所说的在线热更新就是,例如对已经发布在应用市场上的宿主APK,当我们从crash统计平台上发现某个函数调用有bug,导致…
CART决策树和随机森林
CART 分裂规则 将现有节点的数据分裂成两个子集,计算每个子集的gini index 子集的Gini index: $$gini_{child}=\sum_{i=1}^K p_{ti} \sum_{i’ \…
【读书笔记】数学之美(下)
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles,不允许转载~ 文章中的数学公式若无法正确显示,请参见:正确显示数学公式的小技巧 本文为《数学之美》的读书笔记。…
C++(十四) — 常用快捷键总结
快捷键设置方法:https://blog.csdn.net/wrzfeijianshen/article/details/53230789 https://blog.csdn.net/wrzfeijians…
机器学习 博客
推荐一个关于机器学习和深度学习资料集合的csdn博客,需要的时候可以去查找和整理 http://blog.csdn.net/smf0504/article/details/52744737
机器学习路线 方法 python scikit-learn spark mllib
机器学习开发与应用 &nbs…
机器学习经典书籍&论文
原文地址:http://blog.sina.com.cn/s/blog_7e5f32ff0102vlgj.html 入门书单 1.《数学之美》PDF6 作者吴军大家都很熟悉。以极为通俗的语言讲述了数学在机器学习和自然语言…
数据样本不平衡问题处理方法
很多分类学习方法针对都有一个共同的基本假设,即不同类别的训练数据数目相当,即使稍有差别,通常影响不大。但如果差别较大,就会对学习过程造成困扰。 在现实场景中,比如银行欺诈,异常登录,网络入侵等领域中,大多数数据通常有不到…
机器学习系列-最近邻分类器
最近邻分类器 消极学习方法 一般的分类器,比如决策树和支撑向量机,只要有训练数据可用,它们就开始学习从输入属性到类标号的映射模型,这类学习策略被称为积极学习方法。与之相对的是消极学习算法,它的策略是推迟对训练数据的建模,…
scikit-learn系列之如何存储和导入机器学习模型
scikit-learn系列之如何存储和导入机器学习模型 如何存储和导入机器学习模型 找到一个准确的机器学习模型,你的项目并没有完成。本文中你将学习如何使用scikit-learn来存储和导入…