h2o高性能机器学习框架教程 本文为2016年H2O Open Chicago上的内容。 译者注: 在使用H2O前你需要: 安装java环境(需下载64位JDK,不然在R中不能控制通过h2o.init()函数来控制 内存…
标签:机器学习
学习笔记TF061:分布式TensorFlow,分布式原理、最佳实践
分布式TensorFlow由高性能gRPC库底层技术支持。Martin Abadi、Ashish Agarwal、Paul Barham论文《TensorFlow:Large-Scale Machine Learning…
机器学习实验笔记
实验1 — 基于 RNN 的 MNIST 手写字符识别实验 工作流 预处理(转化为灰度图) — 卷积 — 池化 — 卷积 — 池化 — 全连接层 &…
转载:机器学习资料
转自:https://www.cnblogs.com/AlgrithmsRookie/p/11692444.html 从机器学习到深度学习资料整理 在过去的大半年中,博主一直在进行人工智能相关知识的自学。由于人工智能…
Python机器学习库sklearn的安装
Python机器学习库sklearn的安装 scikit-learn是Python的一个开源机器学习模块,它建立在NumPy,SciPy和matplotlib模块之上能够为用户提供各种机器学习算法接口,可以让用户简单、高…
机器学习中的标签数据和无标签数据
今天在数据人网上看到一篇文章。区分监督学习和无监督学习,监督学习的数据就是有标签数据,无监督学习的数据就是无标签数据。这是我的理解,欢迎指教。 原文链接http://www.shujuren.org/article/…
为什么扩大数据集可能导致分类效果下降?
本文目录 0. 说明 1. 问题背景 2. 原因分析 2.1 有没有可能是因为新数据的标签不够准确? 2.2 是不是因为数据分布发生了变化? 3. 举个栗子 4. (强行)理论解释 4.1 一种解释 4.2 另一种解释 …
机器学习和深度学习中如何处理数据不平衡问题
如何处理数据不平衡问题 前言 在您正在处理数据集时您可以创建分类模型并立即获得90%的准确度。你觉得“非常不错”。但是当你深入一点时,发现90%的数据属于一个类。 这是一个不平衡数据集的例子,它可能导致令人沮丧的结果。 …
将dataframe中的某一行提取出来放到另一个dataframe中
因为训练集和测试集的特征是放在一个文件中的,所以需要把训练集的特征提取出来。 最后才想到直接使用dataframe中的append方法,它的参数如下,可以传入dataframe,series,dict, Paramete…
记一次PMML文件的处理过程
背景 业务方说需要我做个web界面,在上面输入一条网站访问线索的信息,后台通过机器学习计算这条线索的评级,例如这条线索对应的用户购买意愿有多强之类的。而机器学习对应的模型,也是业务方自己用KNIME这个软件训练的,然后将…
用PMML实现机器学习模型的跨平台上线
在机器学习用于产品的时候,我们经常会遇到跨平台的问题。比如我们用Python基于一系列的机器学习库训练了一个模型,但是有时候其他的产品和项目想把这个模型集成进去,但是这些产品很多只支持某些特定的生产环境比如Jav…
机器学习
机器学习 概述 什么是机器学习 机器学习是一门能够让编程计算机从数据中学习的计算机科学。 一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E增加而增加,那么这样计…