此篇博客所有源码均来自JDK 1.8 作者:大明哥 原文地址:http://cmsblogs.com 说明 队列是比较常见的数据结构,我们也经常使用到,BlockingQueue常用于生产者消费者场景,在Jav…
标签:数据挖掘
深度揭秘Airbnb的跨洋大数据挑战及架构实战
“ 大数据时代,每个公司都会遇到一些共性的挑战,比如大数据的采集、整合、存储、计算。Airbnb 在大数据平台架构构建的过程中,也收获了很多宝贵的经验。 2017 年 12 月 1 日-2 日,由 51CTO 主办的 W…
论文 | 通过快速查找和发现密度峰值进行聚类
原文:Clustering by fast search and find of density peaks作者:Alex Rodriguez and Alessandro Laio来源:Science 344.6191…
乱炖数据之2700余篇“简书交友”专题文章数据的花式玩法
写完才发现文章略长,想看小姐姐的请拖到最后,一次性看个够(侵删),看完后请点下贤者之赞再走哦。 一、背景介绍 简书上有个“简书交友”专题,经常会有人写些自己的情况、贴贴自己的照片然后投稿到这一专题,有介绍的比较详细的比如…
使用 Python 和 Pandas 分析 Pronto CycleShare 数据
这是一篇非常不错的 pandas 分析入门文章,在此简单翻译摘录如下。 本周,西雅图的自行车共享系统 Pronto CycleShare 一周岁了。 为了庆祝这一点,Pronto 提供了从第一年的数据缓存,并宣布了 Pr…
机器学习面试题-数据挖掘中如何判断关联规则有效性
机器学习面试题-数据挖掘中如何判断关联规则有效性 持续整理有温度、有难度、有热度的机器学习面试笔试题。 机器学习面试笔试题 – Github 机器学习面试笔试题 – Gitbook 关联规则的三个…
数据质量管理的一些思考 – ThoughtWorks洞见
背景 在近期的项目当中,我们为客户落地实施了数据资产平台。随后,在数据平台中接入了客户子公司的一个业务系统的明细数据。客户希望在我们的数据平台上通过数据探索和数据分析,来挖掘一些业务价值和业务创新点。 当我们拿到数据开始…
浅谈Julia语言:Julia的面向对象
Julia语言将在今年8月6日发布1.0版本,我相信很多一直在观望的人也已经跃跃欲试了。这个系列的文章将结合我在开发Yao的过程中所实际感受到的一些问题和经验来谈谈Julia语言。因为并非PL背景,我不会从语言设计上去介…
Julia 缺失值的表示和处理
Julia语言想在数据分析领域分一杯羹还需要做很多的事情,其中一个事情就算对缺失值的处理。在数据分析中,观测样本存在缺失值是非常常见的,如果一个分析工具缺少应对机制,那么这个工具用起来会磕磕绊绊。 R语言的缺失值处理 R…
Julia快速入门(上)
译者按:Julia是一门非常年轻,但又极具生命力的程序语言,它既有脚本语言的灵活性和易用性,但又不失传统编译语言的一些常见用法和高效率,在很多机构给出的数据科学类程序语言性能评比中,Julia都名列前茅。在译者看来,Ju…
Julia 简明应用:十分钟 Julia 从零到安装
曾闻言Julia, Walks like python. Runs like C. Julia 1.0.0下载网址:julialang.org/downloads/ Julia安装 打开Julia,此时显示的…
Julia:高效易用的数值计算/优化编程语言
今天忙里偷闲,简单科普一下Julia这款非常好用的编程语言。个人感觉,对做优化/数值计算的人来说,这是目前最好用的语言了。对我来说,3年来自从用了Julia我就再也不用Matlab了,连Python我觉得也基本没有用的需…