A/B测试是基于数据来进行优选的常用方法,但是你真的了解A/B测试背后的统计学原理吗?当A/B测试遇到非简单情况时(如分组不够随机时,或用户量不够大到可以忽略组间差异,或不希望大规模A/B测试长期影响一部分用户的收益),…
分类:数据挖掘
BOM 惨案
在提惨案前先说说遇到一件奇怪的事。 某次偶然在 elacticsearch 中发现有些小红点的东西,但是不知道是什么,像这样。 当时我并不知道这是什么,但时它刚好出现在了关键位置,让我的程序数据匹配不上,我当时并未深究,…
机器学习与数据挖掘: 基础概念
如何成为机器学习工程师https://keras-cn.readthedocs….http://www.tensorfly.cn/tfdoc… 机器学习 vs 数据分析 数据特点 数据分析 机…
基于‘BOSS直聘招聘信息’分析企业到底需要什么样的PHPer
原文地址:http://www.jtahstu.com/blog/s… 基于‘BOSS直聘招聘信息’分析企业到底需要什么样的PHPer 前两篇文章都没看,好意思直接看结果? Python爬虫框架Scrapy实…
书单分享
了解一个新的领域,其中一个方法就是大量的阅读,进而产生一个基本的认识。 之前研究过推荐系统,机器学习,一路走来也积累了一些书单,丢失了一些,如今还剩这些。在此分享给大家,里面有不少有关机器学习和数据挖掘,还有 Pytho…
相似度分析
最近了解了几个相似度分析相关的算法,整理一下。 曼哈顿距离(Manhattan Distance) 曼哈顿距离又叫城市街区距离,形象的理解一下就是你要从城市的一个地方到另一个地方,怎么计算你行驶的距离。如下图,想象一下,…
NodeQuant:一个基于Node.js的开源量化交易平台
NodeQuant:一个基于Node.js的开源量化交易平台 NodeQuant的愿景 让Node.js社区轻巧地开发和部署量化金融交易程序,成为一个简单、高效、可依赖的量化交易平台:NodeQuant开发文档 Node…
【译】特征工程最佳实践
本文是译文,可以转载,但需注明出处,点击这里可以获取原文,有删减。 机器学习中,特征工程是创建新特征,能有效提高模型性能的方法之一。 特征工程比较困难,耗时且需要领域专业知识。 应用机器学习的基础是特征工程。 ———吴恩…
模型评价(一) AUC大法
问题: AUC是什么 AUC能拿来干什么 AUC如何求解(深入理解AUC) AUC是什么 混淆矩阵(Confusion matrix) 混淆矩阵是理解大多数评价指标的基础,毫无疑问也是理解AUC的基础。丰富的资料介绍着混…
各种API+教程+练习
做一个搬运工,希望自己能努力学习,也希望大神们的东西能让更多的人看到 不断更新 更新日志:2017.10.13 新增了网络安全分类,整理了排版布局9.28 新增了seaborn的API链接,将一些杂七杂八的东西弄到了一篇…
天池大数据比赛总结
一直想总结一下这次的比赛,拖啊拖。。。一直等到现在,趁着现在要找实习,好好总结一下。 比赛题目 比赛的官方网站在这,IJCAI SocInf’16。 这次比赛的题目是给定 2015 年 7 ~ 11 月份的用…
大数据分析,鲁班为祖师
1.《全栈数据之门》现货上架 经过一段时间的等待,目前已经可以在各大电商平台『现货』购买本书。本文后面也有京东、当当、天猫的购买链接! 本书适用 本书以数据分析领域最热的Python语言为主要线索,介绍数据分析库Nump…