【机器学习】 1) 云端可视化机器学习/深度学习量化平台 http://t.cn/RHb9PxI 2) SWATS:自动由Adam切换为SGD而实现更好的泛化性能 http://t.cn/RHqPJuw 3) +Mome…
标签:自然语言处理
学习笔记CB013: TensorFlow、TensorBoard、seq2seq
tensorflow基于图结构深度学习框架,内部通过session实现图和计算内核交互。 tensorflow基本数学运算用法。 import tensorflow as tf sess = tf.Session() a…
NLP | 自然语言处理 - 语言模型(Language Modeling)
为什么需要语言模型? 想象“语音识别”这样的场景,机器通过一定的算法将语音转换为文字,显然这个过程是及其容易出错的。例如,用户发音“Recognize Speech”,机器可能会正确地识别文字为“Recognize&nb…
史上最详细最容易理解的HMM文章
http://www.52nlp.cn/hmm-learn-best-practices-four-hidden-markov-models wiki上一个比较好的HMM例子 分类 隐马尔科夫模型 HMM…
关于信息抽取的整理总结(上)
动机 自然语言处理的课上老师介绍了关于信息抽取的相关内容,结合老师课件提到的相关文献,写一篇整体的总结将本类文献进行汇总,以便后续根据研究需要引用和深入阅读文献。 1. 信息抽取概述 1.1 信息抽取定义 一般意义上,信…
中文(语音结果)的文本纠错综述 Chinese Spelling Check
中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等。这边简单梳理下对于这个任务的调研结果。 综述中很多内容参考了 hqc888688 的这篇博客,非常感谢。 1. 问题分析 1.1 definit…
Python批量合并多个txt文件
# -*- coding:utf-8 -*- #os模块中包含很多操作文件和目录的函数 import os #获取目标文件夹的路径 meragefiledir = os.getcwd()+'\\MerageFiles' …
关于信息抽取的整理总结(下)
4. 实体抽取和发现 4.1 关系抽取任务定义 Alexander Schutz等人认为关系抽取是自动识别由一对概念和联系这对概念的关系构成的相关三元组。 Example1: 比尔盖茨是微软的CEO CEO(比尔盖茨,…
2-知识表示-知识图谱-自然语言处理
来源:《中文信息处理报告》 知识表示 对客观世界知识进行 建模,让 机器识别和 理解, 要考虑到的因素是知识的 表示,存储,使用,运算。 要解决的关键问题是&nbs…
学习笔记CB005:关键词、语料提取
关键词提取。pynlpir库实现关键词提取。 # coding:utf-8 import sys import importlib importlib.reload(sys) import pynlpir pynlpir…
批量Python依赖包下载与离线安装
搭建环境 首先要根据目标服务需要的环境,在本地搭建尽量相同的环境,如python版本、pip版本等。 确认依赖包名与版本 在其他环境中找到要安装的依赖包名及版本并导出:pip freeze > requiremen…
学习笔记CB001:NLTK库、语料库、词概率、双连词、词典
聊天机器人知识主要是自然语言处理。包括语言分析和理解、语言生成、机器学习、人机对话、信息检索、信息传输与信息存储、文本分类、自动文摘、数学方法、语言资源、系统评测。 NLTK库安装,pip install nltk 。执…