递归神经网络可存储记忆神经网络,LSTM是其中一种,在NLP领域应用效果不错。 递归神经网络(RNN),时间递归神经网络(recurrent neural network),结构递归神经网络(recursive neur…
标签:自然语言处理
学习笔记CB001:NLTK库、语料库、词概率、双连词、词典
聊天机器人知识主要是自然语言处理。包括语言分析和理解、语言生成、机器学习、人机对话、信息检索、信息传输与信息存储、文本分类、自动文摘、数学方法、语言资源、系统评测。 NLTK库安装,pip install nltk 。执…
【手撕 - 自然语言处理】手撕 TextRank(03)我自己实现的 C++ 版
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~ 1. 概述 TextRank 论文地址: https://www.aclweb.org/ant…
学习笔记CB008:词义消歧、有监督、无监督、语义角色标注、信息检索、TF-IDF、隐含语义索引模型
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。 …
【手撕 - 自然语言处理】手撕 TextRank(02)大佬是怎么实现 C++ 版的
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~ 1. 源码来源 comoody 大佬的源码:https://github.com/comood…
【好东西传送门日报】2017-12-27 星期三
【机器学习】 1) 云端可视化机器学习/深度学习量化平台 http://t.cn/RHb9PxI 2) SWATS:自动由Adam切换为SGD而实现更好的泛化性能 http://t.cn/RHqPJuw 3) +Mome…
学习笔记CB005:关键词、语料提取
关键词提取。pynlpir库实现关键词提取。 # coding:utf-8 import sys import importlib importlib.reload(sys) import pynlpir pynlpir…
学习笔记CB014:TensorFlow seq2seq模型步步进阶
神经网络。《Make Your Own Neural Network》,用非常通俗易懂描述讲解人工神经网络原理用代码实现,试验效果非常好。 循环神经网络和LSTM。Christopher Olah http://cola…
jieba与nltk结合处理评论(一)
0.前言 操作系统:Windows 64 开发工具:pycharm 全部代码以及使用材料下载下载地址 1.使用jieba对中文进行分词 1.1 测试文本 本次实验的评论comment2中的内容为: 使用了一周多才来评价 …
学习笔记CB008:词义消歧、有监督、无监督、语义角色标注、信息检索、TF-IDF、隐含语义索引模型
词义消歧,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义消歧,可通过机器学习方法解决。词义消歧有监督机器学习分类算法,判断词义所属分类。词义消歧无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。 …
学习笔记CB010:递归神经网络、LSTM、自动抓取字幕
递归神经网络可存储记忆神经网络,LSTM是其中一种,在NLP领域应用效果不错。 递归神经网络(RNN),时间递归神经网络(recurrent neural network),结构递归神经网络(recursive neur…
学习笔记CB004:提问、检索、回答、NLPIR
聊天机器人,提问、检索、回答。 提问,查询关键词生成、答案类型确定、句法和语义分析。查询关键词生成,提问提取关键词,中心词关联扩展词。答案类型确定,确定提问类型。句法和语义分析,问题深层含义剖析。检索,搜索,根据查询关键…