好程序员大数据教程Scala 系列之 类 1. 类的定义 Scala 访问修饰符基本和Java的一样,分别有:private,protected,public。 如果没有指定访问修饰符符,默认情况下,Scal…
分类:数据挖掘
Python遗传算法框架DEAP-Creating Types
DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 This tutorial show…
[自翻译][机器学习]什么是机器学习技术?
本文首次发表于译言网,翻译自Technet.com,为[机器学习]系列文章之一。 发表地址:http://article.yeeyan.org/view/propiram/442033 这篇博客文章由微软研究院的杰出科学…
【学习摘录】机器学习特征选择
应用过机器学习进行数据挖掘的同学应该都知道特征选择对模型表现的重要性。本文基于网上经典特征选择相关文章整理出干货:常用方法分类以及调包侠该如何用sklearn快速上手,供大家参考。 (一)预处理: 1 无量纲化: 1.1…
LibShortText简要入门
LibShortText是一个开源的Python短文本(包括标题、短信、问题、句子等)分类工具包。它在LibLinear的基础上针对短文本进一步优化,主要特性有: – 支持多分类 – 直接输入文本…
2019网易互娱数据挖掘实习生笔试部分记录
今晚做完了网易互娱数据挖掘实习生的笔试题,虽然大部分的题目都不太记得了。但是还是有一些印象比较深的坑需要填一下。比起腾讯和字条跳动难度适中,不算很大,字节的笔试挂了。其实这次感觉自己做的也不是挺好哈哈哈。 1、题型 笔试…
oracle 基于数据挖掘的不完全恢复
由于某种误操作需要恢复数据库。当然我们都知道,假如自己之前有备份数据库可以用rman进行恢复,但是这样的情况就会恢复倒备份的时刻状态,而不是误操作的时候的状态,也可以叫做造成恢复过度…
当我们说数据挖掘的时候我们在说什么
开头下定语:统计学习 现在市面上谈论到的数据挖掘基本上都是基于统计学习的监督学习或非监督学习问题。尤其以监督学习应用面更广。 统计学习的应用 分类问题:客户分类模型、异常鉴别、图像识别等标注问题:信息抽取、自然语言处理等…
Spark数据分析概念入门
原文地址: http://blog.52sox.com/Spark-d… 在大数据的时代,数据的各种术语层出不穷,比如数据仓库、数据湖,还有比较热门的Hadoop、Spark,让人眼花缭乱。在这里,我们主要介…
Python遗传算法框架DEAP-Creating Types
DEAP是一个python遗传算法框架,这里是它的简介。DEAP documentation今天整理一下DEAP的概览,大体了解一下它的流程。初学,不严谨,仅作为自己的备忘学习笔记。 This tutorial show…
【一】Python学习笔记---异常处理
Python使用被称为,异常的特殊处理对象来管理程序执行期间发生的错误。 异常,是使用 try-except 代码块处理,try-except代码块让Python执行指定的操作, 同时告诉Python发生异常时怎么办。
实现安卓流量数据采集与标记
准备工作: 1.学习java以及安卓开发,我读了JAVA核心技术和第一行代码 2. 利用PackageManager管理器,检索所有的应用程序与数据目.再用ActivityManager与PackagesInfo获取从上…