距离春节还有不到一个月的时间,又到了一年一度的春运订票抢票高峰。AI 能帮什么忙? AI 自动刷票、安全大脑“云抢票”、图形验证码自动识别等抢票黑科技层出不穷。但还有一样黑科技你可能还没发现,像携程、去哪儿等旅行订票网站…
分类:自然语言处理
主题模型在推荐系统中的应用
1、什么是推荐系统中的冷启动问题 推荐系统中的冷启动问题:在没有大量用户数据的情况下如何给用户进行个性化推荐,目的是优化点击率、转化率或用户体验。 冷启动问题: 用户冷启动 物品冷启动 系统冷启动 解决冷启动问题的方法一…
生成式模型 VS 判别式模型
假设可观测到的变量集合为 X,需要预测的变量集合为 Y,其他变量集合为 Z。 生成式模型是对联合概率分布 P(X,Y,Z) 进行建模,在给定观测集合 X 的条件下,通过计算边缘分布来得到对集合 Y 的推断,即: imag…
MCMC 采样
蒙特卡罗方法 原理是通过大量随机样本,去了解一个系统,进而得到所要计算的值。 概率分布采样 如何基于概率分布去采样基于这个概率分布的 n 个 x 的样本集? 一些常见的连续分布,比如t分布,F分布,Beta分布,Ga…
Text-CNN、Word2Vec、RNN、NLP、Keras、fast.ai-20180504
本文集仅为收录自己感兴趣、感觉不错的文章与资源,方便日后查找和阅读,所以排版可能会让人觉得乱。内容会不断更新与调整。文中涉及公众号的文章链接可以会失效,知道如何生成永久链接的小伙伴还望告知。 此前更新的不频繁,尽量之后多…
CUI三部曲之语音识别——机器如何听懂你的话?
在智能时代,以对话为主要交互形式的CUI会应用到越来越多的场景中。进行对话交互时,机器往往需要完成“听懂——理解——回答”的闭环。这个闭环涉及到三类技术:语音识别(ASR)、自然语言处理(NLP)以及语音合成(TTS)。…
NLP进阶 CRF深入理解
介绍 说起概率无向图模型,一般会想到CRF(条件随机场)和ME(最大熵模型),此两种从不同的角度都可以拿来用于NLP方面的任务,序列标注任务比如词性识别,通常用到CRF,通常无向图判别模式可分…
夸夸 AI 机器人,免费夸你上天!
最近,“夸夸群” 彻底火了…… 在夸夸群里,无论你说什么,心情再差、遇到的事情再丧,都能求夸,就连打个“哈哈哈哈哈”都能得到一票人众星捧月般的夸奖。 各种不着边际的求夸,加上各种搞笑的吹捧,让人们…
LSTM网络层详解及其应用实例
上一节我们介绍了RNN网络层的记忆性原理,同时使用了keras框架听过的SimpleRNN网络层到实际运用中。然而使用的效果并不理想,主要是因为simpleRNN无法应对过长单词串的输入,在理论上,当它接收第t个输入时,…
Facebook 无监督语言翻译模型
声明:转载请声明作者,并添加原文链接。 简介 这篇博客主要解读无监督翻译算法。参考论文是 Lample, Guillaume, et al. “Phrase-Based & Ne…
NLP 之 自然场景 文字识别 1 Scene text recognition ICDAR 2003 preprocess
初来 咋到, 很多坑需要自己一个一个过。 就比如数据预处理, 我谷歌了好半天 也没找到现成的轮子, 只好自己写一个了。 参考的论文是An End-to-End Trainable Neural Network for I…
transformer再记(编码器)
transformer整体结构 Attention Is All You Need(2017.6) 本文从微观角度(张量角度)讨论transformer的前向传播 自注意力层 一、计算自注意力的第一步就是用每个编码器的输…