环境搭建-机器学习入门(一) 机器学习不建议直接自行配置python环境,各种第三方库的版本相当难处理。所以需要安装Anaconda3直接搭建一个完整的机器学习环境 Linux环境配置(centos7.4) 执行下列命令…
分类:机器学习
Precision,Recall,TPR,FPR,ROC,AUC,F1辨析
常见统计学习的性能指标 分类结果 对于一个二分类问题,分类结果如下: – – 预测 预测 – – – 1 0 合计 实际 1 True Positive(TP)…
代码题(54)— 最长公共前缀
1、14. 最长公共前缀 编写一个函数来查找字符串数组中的最长公共前缀。 如果不存在公共前缀,返回空字符串 ""。 示例 1: 输入: ["flower","flow","flight"] …
Python-Levenshtein 安装
编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。 许可的编辑操作包括:将一个字符替换成另一个字符,插入一个字符,…
机器学习——LightGBM
基础概念 LigthGBM是boosting集合模型中的新进成员,它和xgboost一样是对GBDT的高效实现,很多方面会比xgboost表现的更为优秀。原理上它和GBDT及xgboot类似,都采用损失函数的负梯度作为当…
将dataframe中的某一行提取出来放到另一个dataframe中
因为训练集和测试集的特征是放在一个文件中的,所以需要把训练集的特征提取出来。 最后才想到直接使用dataframe中的append方法,它的参数如下,可以传入dataframe,series,dict, Paramete…
机器学习系统第二章代码详解
figure1.py pythonimport numpy as np from sklearn.datasets import load_iris from matplotlib import pyplot as pl…
学习笔记TF060:图像语音结合,看图说话
斯坦福大学人工智能实验室李飞飞教授,实现人工智能3要素:语法(syntax)、语义(semantics)、推理(inference)。语言、视觉。通过语法(语言语法解析、视觉三维结构解析)和语义(语言语义、视觉特体动作含…
0x07 数据民工,一致性洗车
摘要:数据科学家是二十一世纪最性感的的职业。面临充斥着脏乱差的数据,处理数据一致性问题是其中一项重要任务。人的强项在于智能,却不善于处理重复且枯燥无味的事情。机器不具有智能,却善于处理重复且简单的事情。 01 性感还是闷…
TensorFlow 2.0 / TF2.0 入门教程实战案例
用最白话的语言,讲解机器学习、神经网络与深度学习 示例基于 TensorFlow 1.4 和 TensorFlow 2.0 实现 相关链接 知乎专栏 机器学习笔试面试题,Github TensorFlow 2.0 中文文…
【手撕 - 自然语言处理】手撕 FastText 源码(01)分类器的预测过程
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~ 1. 源码来源 FastText 源码:https://github.com/facebook…
【机器学习基础】熵、KL散度、交叉熵
熵(entropy)、KL 散度(Kullback-Leibler (KL) divergence)和交叉熵(cross-entropy)在机器学习的很多地方会用到。比如在决策树模型使用信息增益来选择一个最佳的划分,…