[译] Advanced R by Hadley Wickham 数据结构 本章主要总结base R中最重要的数据结构。你之前很有可能已经使用到它们,或者它们中的一部分,但是可能从来没有用心思考过它们之间有什么关联。这里…
分类:数据挖掘
梯度下降法变种的汇总
引言 在各类优化方法中,梯度下降法(Gradient Descent)是最为常见的策略。这里将对一些常见的梯度下降法的变种做一个梳理。方便大家更好地理解梯度下降法的应用域。 如何理解梯度下降法 假想一个状态,你在徒步中准…
《全栈数据之门》初稿完成
《全栈数据之门》(暂定书名)是末学近5年来工作技能的积累,从8个月前开通公众号写的第一篇起,中间也不知度过了多少个寂寞的夜晚。 写文章本来就是一个很费力的活,况且写书要求还得高些。 原计划写的是七章,每章七篇,共计七七得…
当我们说数据挖掘的时候我们在说什么
开头下定语:统计学习 现在市面上谈论到的数据挖掘基本上都是基于统计学习的监督学习或非监督学习问题。尤其以监督学习应用面更广。 统计学习的应用 分类问题:客户分类模型、异常鉴别、图像识别等标注问题:信息抽取、自然语言处理等…
数据挖掘 入门
以下是 郭鹏程在“小象学院微课”分享的“数据挖掘”初级内容,本人整理 如今数据行业正式火热的时候,不少公司纷纷设置数据岗位,也有很多创业公司从数据角度入手,同时,不少高校也成立了数据专业。特别是大数据这个名词,已经被热炒…
一个段子来解释数据挖掘
先来一个自编的段子镇楼: 话说这齐天大圣孙悟空大闹天宫,玉帝派二郎神杨戬去镇压,兵力占尽优势却屡次不胜。问题就在孙猴子有一招十分厉害的分身术,拔一把毫毛一吹一变,地上就冒出成千上万只一模一样的猴子,每次大费周章抓回的都是…
推荐引擎算法 - 猜你喜欢的东西
我在github上写的文章,复制过来格式太乱,还是直接用链接吧。 http://sunmh207.github.io/2016/02/01/recommendcourses/
一起来复习Data Science:那些让人抓狂的回归分析
回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。在此,我讲会从机器学习和统计学两个方面分别描述回归在两个领域中的区别。 线性回归 常见的线性回归基于以下模…
达观数据于敬:个性化推荐系统实践
达观数据于敬:个性化推荐系统实践 在DT(data technology)时代,网上购物、观看视频、聆听音乐、阅读新闻等各个领域无不充斥着各种推荐,个性化推荐已经完全融入人们的日常生活当中。个性化推荐根据用户的历史行为数…
Python遗传算法框架DEAP-Operators and Algorithms
Before starting with complex algorithms, we will see some basics of DEAP. First, we will start by creating sim…
数据挖掘中几个指标的含义及示例
指标含义 支持度(SUPPORT) 支持度表示项集{X,Y}在总项集里出现的概率。 计算公式为: 其中I表示总事务集。num()表示求事务集里特定项集出现的次数。 置信度(CONFIDENCE) 置信度表示在先决条件X发…
Python遗传算法框架DEAP-Creating Types
DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 This tutorial show…