0. 环境介绍 Python 版 本: 3.6.2 操作系统 : Windows 集成开发环境: PyCharm 1. 安装Python环境 安装Python 首先,我们需要安装Python环境。本人选择的是64位版本…
标签:机器学习
梯度是如何计算的
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 引言 深度学习模型的训练本质上是一个优化问题,而常采用的优化算法是梯度下降法(GD)。对于GD算法,最重要的就是如何计算梯度。此时,估计…
简单易懂的自动编码器
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 引言 自动编码器是一种无监督的神经网络模型,它可以学习到输入数据的隐含特征,这称为编码(coding),同时用学习到的新特征可以重构出原…
RNN入门与实践
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 引言 循环神经网络(Recurrent Neural Network, RNN)是神经网络家族的重要成员,而且也是深度学习领域中的得力干…
ResNet, AlexNet, VGG, Inception: 理解各种各样的CNN架构
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 本文翻译自ResNet, AlexNet, VGG, Inception: Understanding various architec…
CNN模型之ShuffleNet
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 引言 ShuffleNet是旷视科技最近提出的一种计算高效的CNN模型,其和MobileNet和SqueezeNet等一样主要是想应用在…
详解深度学习中的梯度消失、爆炸原因及其解决方法
前言 本文主要深入介绍深度学习中的梯度消失和梯度爆炸的问题以及解决方案。本文分为三部分,第一部分主要直观的介绍深度学习中为什么使用梯度更新,第二部分主要介绍深度学习中梯度消失及爆炸的原因,第三部分对提出梯度消失及爆炸的解…
CUDA编程入门极简教程
码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 前言 2006年,NVIDIA公司发布了CUDA,CUDA是建立在NVIDIA的CPUs上的一个通用并行计算平台…
分布式TensorFlow入门教程
码字不易,欢迎给个赞! 欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 前言 深度学习在各个领域实现突破的一部分原因是我们使用了更多的数据(大数据)来训练更复杂的模型(深度神经网络),…
机器翻译不可不知的Seq2Seq模型
机器翻译——Seq2Seq模型 介绍 设计目标 主要概念 Encoder-Decoder Attention模型 CNN的seq2seq 应用领域 参考 介绍 Seq2Seq,全称Sequence to Sequence…
CNN模型之SqueezeNet
欢迎交流与转载,文章会同步发布在公众号:机器学习算法全栈工程师(Jeemy110) 引言 SqueezeNet是Han等提出的一种轻量且高效的CNN模型,它参数比AlexNet少50x,但模型性能(accuracy)与A…
CNN模型之MobileNet
引言 卷积神经网络(CNN)已经普遍应用在计算机视觉领域,并且已经取得了不错的效果。图1为近几年来CNN在ImageNet竞赛的表现,可以看到为了追求分类准确度,模型深度越来越深,模型复杂度也越来越高,如深度残差网络(R…