介绍 说起概率无向图模型,一般会想到CRF(条件随机场)和ME(最大熵模型),此两种从不同的角度都可以拿来用于NLP方面的任务,序列标注任务比如词性识别,通常用到CRF,通常无向图判别模式可分…
标签:自然语言处理
主题模型在推荐系统中的应用
1、什么是推荐系统中的冷启动问题 推荐系统中的冷启动问题:在没有大量用户数据的情况下如何给用户进行个性化推荐,目的是优化点击率、转化率或用户体验。 冷启动问题: 用户冷启动 物品冷启动 系统冷启动 解决冷启动问题的方法一…
NLP入门(一)词袋模型及句子相似度
本文作为笔者NLP入门系列文章第一篇,以后我们就要步入NLP时代。 本文将会介绍NLP中常见的词袋模型(Bag of Words)以及如何利用词袋模型来计算句子间的相似度(余弦相似度,cosine similar…
NLP系列学习:DBOW句向量
最近在看这一篇文章,在网上也看到了很好的翻译,总结一下,写一下自己的看法,不足之处还是多多指教~ 分布记忆模型(PV-DM) 用神经网络训练词向量的逻辑是,让网络去预测单词(目标词/上下文)这样的任务,句向量也是一样,我…
荷塘月色还可以这样唱
新荷塘月色 改写:传习者戚 by python3 端一杯美酒慢慢品尝 闯进了月色中轻轻荡漾 读一本小船逆流而上 美丽的歌声也靠在我身旁 痴情男点亮爱的星光 谁又是捡一块梦的衣裳 扮出那份异样重重地放 谁赶走那一股现在的彷…
神经网络语言建模系列之三:重要性采样
重要性采样(Important Sampling, IS)属于蒙特卡洛(Monte Carlo)方法,被Bengio and Senecal (2003)引入到神经网络语言建模中,用于加速神经网络语言模型的训练。重要性采…