聊天机器人,提问、检索、回答。 提问,查询关键词生成、答案类型确定、句法和语义分析。查询关键词生成,提问提取关键词,中心词关联扩展词。答案类型确定,确定提问类型。句法和语义分析,问题深层含义剖析。检索,搜索,根据查询关键…
分类:自然语言处理
关于信息抽取的整理总结(上)
动机 自然语言处理的课上老师介绍了关于信息抽取的相关内容,结合老师课件提到的相关文献,写一篇整体的总结将本类文献进行汇总,以便后续根据研究需要引用和深入阅读文献。 1. 信息抽取概述 1.1 信息抽取定义 一般意义上,信…
【手撕 - 自然语言处理】手撕 FastText 源码(01)分类器的预测过程
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles ,不允许转载~ 1. 源码来源 FastText 源码:https://github.com/facebook…
【读书笔记】数学之美(上)
作者:LogM 本文原载于 https://segmentfault.com/u/logm/articles,不允许转载~ 文章中的数学公式若无法正确显示,请参见:正确显示数学公式的小技巧 本文为《数学之美》的读书笔记。…
中文(语音结果)的文本纠错综述 Chinese Spelling Check
中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等。这边简单梳理下对于这个任务的调研结果。 综述中很多内容参考了 hqc888688 的这篇博客,非常感谢。 1. 问题分析 1.1 definit…
Python批量合并多个txt文件
# -*- coding:utf-8 -*- #os模块中包含很多操作文件和目录的函数 import os #获取目标文件夹的路径 meragefiledir = os.getcwd()+'\\MerageFiles' …
关于信息抽取的整理总结(下)
4. 实体抽取和发现 4.1 关系抽取任务定义 Alexander Schutz等人认为关系抽取是自动识别由一对概念和联系这对概念的关系构成的相关三元组。 Example1: 比尔盖茨是微软的CEO CEO(比尔盖茨,…
2-知识表示-知识图谱-自然语言处理
来源:《中文信息处理报告》 知识表示 对客观世界知识进行 建模,让 机器识别和 理解, 要考虑到的因素是知识的 表示,存储,使用,运算。 要解决的关键问题是&nbs…
学习笔记CB005:关键词、语料提取
关键词提取。pynlpir库实现关键词提取。 # coding:utf-8 import sys import importlib importlib.reload(sys) import pynlpir pynlpir…
批量Python依赖包下载与离线安装
搭建环境 首先要根据目标服务需要的环境,在本地搭建尽量相同的环境,如python版本、pip版本等。 确认依赖包名与版本 在其他环境中找到要安装的依赖包名及版本并导出:pip freeze > requiremen…
学习笔记CB013: TensorFlow、TensorBoard、seq2seq
tensorflow基于图结构深度学习框架,内部通过session实现图和计算内核交互。 tensorflow基本数学运算用法。 import tensorflow as tf sess = tf.Session() a…
自然语言处理——TF-IDF
TF-IDF 在自然语言处理——词袋模型与向量化中我们讲到在文本挖掘的预处理中,向量化之后一般都伴随着TF-IDF的处理,那么什么是TF-IDF,为什么一般我们要加这一步预处理呢?这里就对TF-IDF的原理做一个总结。 …