我希望在LSTM中使用CNTK进行多对一设置,即句子中的每个单词都是输入,每个句子的标签是输出.因此,它是从许多输入到一个输出的映射.然而, CNTK Github repository中提供的示例是多对多的.我在理解必…
标签:NLP
LDA主题模型
LDA模型简介 LDA指两者算法,一种叫线性判别分析,一种叫文档主题生成模型,在NLP中我们当然指的是后者。 LDA是一种基于统计的生成模型,它可以根据语料库生成主题模型,并根据这个模型来预测一篇文章属于哪些主题。 算法…
BERT相关论文、文章和代码资源汇总
BERT最近太火,蹭个热点,整理一下相关的资源,包括Paper, 代码和文章解读。 1、Google官方: 1) BERT: Pre-training of Deep Bidirectional Transformers…
NLP选题:6大研究方向助你开启科研之路
编者按:Sebastian Ruder是自然语言处理方面的博士研究生,也是AYLIEN的研究科学家。近日,他撰写了一篇文章,专为初级研究人员选择研究方向提供启发和思路。本文收集了一系列有趣的研究课题,重点关注NLP和迁移…
GAN in NLP | 每周话题精选 #03
「每周话题精选」是根据 PaperWeekly 最近一周的专题交流群讨论沉淀下来的精华内容。目前已成立的专题交流群有:知识图谱,量化,GAN,医疗AI,CV和NVIDIA。 1. 本期问题清单 GAN 目前在 NLP 中…
nlp – Java中的Spacy替代品
我目前使用spacy遍历依赖树,并生成实体. nlp = get_spacy_model(detect_lang(unicode_text)) doc = nlp(unicode_text) entities = set…
机器学习 – LDA对文本分类的良好培训数据?
我正在将基于LDA的内容分类为通用主题,如音乐,技术,艺术,科学 这是我正在使用的过程, 9个主题 – >音乐,科技,艺术,科学等 9个文件 – > Music.txt,Technology.txt,Arts…
NLP+KG名词解释(持续更新,欢迎补充)
关系分类(relation classification):关系分类,又叫关系抽取,就是我有一句话,这句话的两个实体已经标记出来了,那么关系分类就是要找出这句话是描述的这两个实体的什么关系。 远程监督(distant s…
最好用的 AI 开源数据集(涵盖计算机视觉、NLP、语音等 6 大类)
文按计算机视觉、自然语言处理、语音识别、地理空间数据等人工智能的子领域分类,精心整理,每个数据集均附有下载链接,是做 AI 研究不容错过资源。 今天,构造 AI 或机器学习系统比以往任何时候都更加容易。我们有许多开源的最…
NLP自然语言处理从入门到迷茫
最早接触到NLP的时候还是看的李航老师的分享,那时候听了就觉得有点玄幻,机器人和人对话等等场景。后来在和其他的一些算法团队,包括有个基友在搞智能云客服,所以或多或少了解到这块。可惜的是我们当时的业务基本上都是做推荐系统相…
初入NLP领域的一些小建议
ACL2019投稿刚刚落幕,投稿数超过了2800篇,可以说是历史以来最盛大的一届ACL。在深度学习的推动下,自然语言处理这个子领域也逐渐被推上人工智能大舞台的最前列。 最近在跟同学的邮件、或者知乎留言中的交流中,不少同学…
NLP——自然语言处理(三)text2vec包
原创 2017-02-26 余文华 乐享数据DataScientists text2vec简介 text2vec包是由Dmitriy Selivanov于2016年10月所写的R包。此包主要是为文本分析和自然语言处理提供…