文章目录 话题分割常用的语料库 Choi语料库(句子级别) Wiki727语料库(句子级别) clinical 语料库(句子级别) Cities 和Elements 语料库(段落级别) 常用模型 基于语言学的模型 基于机…
分类:自然语言处理
知识图谱的经典知识库总结
文章目录 1 早期的知识库项目 1、Cyc 2、WordNet 3、ConceptNet 2 互联网时代的知识图谱 1 Freebase 2 DBpedia 3 Schema.org 4 Wikidata 5 BabeI…
知识图谱全面总结
文章目录 1 介绍 1.1 定义 1.2 发展历史 1.3 知识图谱的应用 2 数据存储 2.1 资源描述框架(Resource Description Framework,RDF) 2.2 图数据库 2.3 关系型数据…
文本语法纠错不完全调研:学术界 v.s. 工业界最新研究进展
©作者 | 岳天驰 单位 | 腾讯 研究方向 | 自然语言处理 背景 由于用户在文本输入法,语音输入法使用上的随意性,后续又缺少审核,极易产生语法…
自然语言处理—文本分类综述/什么是文本分类
最近在学习文本分类,读了很多博主的文章,要么已经严重过时(还在一个劲介绍SVM、贝叶斯),要么就是机器翻译的别人的英文论文,几乎看遍全文,竟然没有一篇能看的综述,花了一个月时间,参考了很多文献,特此写下此文。 思维导图 …
FOTS:自然场景的文本检测与识别
在这篇文章里,我将分享我实现这篇论文的方法。 问题描述 数据集 关于数据 使用的损失函数 准备检测数据 准备识别数据 训练检测模型和识别模型 代码整合 显示结果 引用 问题描述 我们需要从任何图像(包含文本)检测文本区域…
Python批量合并多个txt文件
# -*- coding:utf-8 -*- #os模块中包含很多操作文件和目录的函数 import os #获取目标文件夹的路径 meragefiledir = os.getcwd()+'\\MerageFiles' …
译文:Relation Classification via Multi-Level Attention CNNs 使用多层级attention机制的CNN进行关系分类
通过多层面的attention CNN的关系分类 原文:Relation Classification via Multi-Level Attention CNNs http://eprints.bimcoordinat…
中文(语音结果)的文本纠错综述 Chinese Spelling Check
中文的文本纠错,应用场景很多,诸如输入法纠错、输入预测、ASR 后纠错等等。这边简单梳理下对于这个任务的调研结果。 综述中很多内容参考了 hqc888688 的这篇博客,非常感谢。 1. 问题分析 1.1 definit…
知识表示发展史:从一阶谓词逻辑到知识图谱再到事理图谱
研究证实,人类从一出生即开始累积庞大且复杂的数据库,包括各种文字、数字、符码、味道、食物、线条、颜色、公式、声音等,大脑惊人的储存能力使我们累积了海量的资料,这些资料构成了人类的认知知识基础。实验表明,将数据依据彼此间的…
Origin2021 三维图的绘制_个别点中垂线绘制
⭐️我叫恒心,一名喜欢书写博客的研究生在读生。 原创不易~转载麻烦注明出处,并告知作者,谢谢!!! 目录 索引区分不同颜色 坐标轴朝向 添加垂直线 在参数调节过程中,如果有两个变量…
语法纠错数据生成方法
语法纠错属于句子级的校对,需要检测并纠正句子中的错误,其中语法纠错目前已经公开的数据量不多,而现在解决语法纠错的问题主要是采用深度学习的模型,这些深度学习的模型需要大量的训练数据,因此本文总结了几种语法纠错数据生成的方法…