用于语法纠错的深度上下文模型 徐明 编译 论文地址:https://www.isca-speech.org/archive/SLaTE_2017/pdfs/SLaTE_2017_paper_5.pdf 相关开源项目:ht…
分类:NLP
文本关键信息抽取整体综述
前言 因为最近项目需要,这里基于资料,个人理解与实际应用进行一个整体性的文本关键信息抽取方法总结。大的方向上,我将关键信息抽取分为以下几个点: 关键词提取、主题提取、实体抽取、关系抽取 下面进行详细的实现分析。 一、关键…
word2vec模型原理及实现词向量训练案例
word2vec模型原理及实现词向量训练案例 word2vec模型原理及介绍 一、博主学习卷积神经网络CNN主要参考下面的四篇文章和视频(需要掌握“两个语言模型”指的是“CBOW”和“Skip-gram”和“两个降低计算…
读取H5文件
import h5py #导入工具包 import numpy as np #打开文件 f = h5py.File(‘c:\lstm_248_114_0.33_0.36.h5′,…
TransE算法的整理
TransE 1 TransE的作用 TransE 作用就是把三元组翻译成embedding词向量的方法 三元组,也就是(头实体,关系,尾实体)的形式,头实体和尾实体统称为实体。为了简化起见,我们用(h,r,t)来表示三…
NLP(三十九)使用keras-bert实现完形填空及简单的文本纠错功能
在之前的系列文章中,笔者介绍了如何使用keras-bert来调用BERT模型,实现文本多分类,文本多标签分类以及序列标注任务,文章如下: NLP(三十四)使用keras-bert实现序列标注任务 NLP(三十五)使用…
Linux服务器上修改深度学习代码
由于本人本地电脑没有配GUP,跑深度学习代码非常慢,所以远程登录linux服务器来运行(但是没法Debug,不如本地用Pycahrm方便呀),下面归纳几个常用修改python代码的linux命令。 一、进入文件夹 cd …
ORC提取图片中文字
前因: 事情是这样的:目前有一个需求,将pdf中的一些内容做成PPT,PDF中的文字不能选中,是以图片形式保存的。如果人工对照PDF打字速度较慢,费时费力,下面不介绍ORC的实现,是介绍如何使用。 主题: orc实现图片…
三大金融文本语料(工商,新闻,资讯) - NLP语料
FinancialDatasets SmoothNLP 金融文本数据集(公开) | Public Financial Datasets for NLP Researches 数据一览 由于github存储有限, 如需全量…
百度艾尼(ERNIE)常见问题汇总及解答
一、ERNIE安装配置类问题 Q1:最适合ERNIE2.0的PaddlePaddle版本是?A1:PaddlePaddle版本建议升级到1.5.0及以上版本。Q2:ERNIE可以在哪些系统上使用?A2:优化后各个系统都会…
[NLP] 秒懂词向量Word2vec的本质
转自我的公众号: 『数据挖掘机养成记』 1. 引子 大家好我叫数据挖掘机皇家布鲁斯特大学肄业我喝最烈的果粒橙,钻最深的牛角尖——执着如我 今天我要揭开Word2vec的神秘面纱直窥其本质 相信我,这绝对是你看到的 最浅白…
【NLP】Attention原理和源码解析
对attention一直停留在浅层的理解,看了几篇介绍思想及原理的文章,也没实践过,今天立个Flag,一天深入原理和源码!如果你也是处于attention model level one的状态,那不妨好好看一下啦。 内容…