import matplotlib.pyplot as plt import numpy as np import numpy.random as randn import pandas as pd from panda…
标签:数据挖掘
一个 6 分钟的 AI 基础了解
人工智能 深度学习 数据挖掘 投资 相关热门文章 GitHub上读北大:覆盖AI高数等130多门课,讲义考题答案全都有,标星已3k+ 阴明 55 6 黑洞图片的背后,是图像处理技术的成熟! 人工智能老李 9 [译] 哪一…
数据挖掘实验 1 贝叶斯
后端 数据挖掘 相关热门文章 [肥朝]原理暂且不谈,定时器你当真会用? 肥朝 51 14 漫话:如何给女朋友解释什么是乐观锁与悲观锁 漫话编程 132 21 [译] Spring 的分布式事务实现 — 使用和不使用 XA…
大数据挖掘更多时间都在于清洗数据
编者按:本文作者汪榕曾写过一篇文章:《以什么姿势进入数据挖掘会少走弯路》,是对想入行大数据的读者的肺腑之言,其中也表达了作者的一些想法,希望大家不要随便去上没有结合业务的收费培训班课程;而后,他有了结合他本人的工作经验,…
[机器学习] 常用激活函数的总结与比较
本文为 CS231n 中关于激活函数部分的笔记。 激活函数(Activation Function)能够把输入的特征保留并映射下来。 Sigmoid Sigmoid 非线性函数将输入映射到 之间。它的数学公式为:。 历史…
CodingLabs - PCA 的数学原理
PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。网上关于PCA的…
当我学完 Python 我学了些什么
本文是本人学完Python后的一遍回顾,加深理解顺便留作手册以备查阅。 学习Python的这几天来,觉得Python还是比较简单,容易上手的,就基本语法而言,但是有些高级特性掌握起来还是有些难度,需要时间去消化。Pyth…
机器学习之决策树和随机森林及代码示例
一、决策树 决策树学习是机器学习中一类常用的算法。在决策树中,根节点包含样本全集。每个非叶子节点表示一种对样本的分割,通常对应一个划分属性,其将样本分散到不同的子节点中。每个叶子节点对应于决策的结果。因此从根节点到每个叶…
机器学习之线性回归及代码示例
一、线性回归 线性回归一般用来做连续值的预测,预测的结果为一个连续值。因训练时学习样本不仅要提供学习的特征向量X,而且还要提供样本的实际结果(标记label),所以它是一种有监督学习。X= { x0 x1 x2 x3 x…
大规模数据的去重与排序
home about guestbook resume categories tags subscribe 业务中可能需要对很大量级(比如100亿)的数据(几十G)进行排序或是去重等操作,在不使用Hadoop等工具的情况…
万亿级日志与行为数据存储查询技术剖析
写在前面 近些年,大数据背后的价值也开始得到关注和重视,越来越多的企业开始保存和分析数据,希望从中挖掘大数据的价值。大数据产生的根本还是增量数据,单纯的用户数据不足以构成大数据,然而用户的行为或行为相关的日志的数据量,加…
验证集、偏差与方差、学习曲线
验证集 机器学习的数据分为三类:训练集、验证集和测试集,刚开始看tensorflow时一直没搞懂验证集是做什么的。 假如要在10个不同次数的多项式间选择,那么训练集就是训练参数每个式子的参数θ,验证集就是用来选择这十个式…