知识推理是知识图谱研究的一大重点和难点
1.1 基于逻辑规则的知识图谱推理
基于逻辑规则的知识图谱推理是指通过在知识图谱上运用简单规则及特征,推理得到新的事实,该方法可以利用知识的符号性,精确度高且能为推理结果提供显式的解释。
基于逻辑规则的推理分为基于逻辑的推理、基于统计的推理和基于图结构的推理。
1.1.1 基于逻辑的推理
基于逻辑的推理是指直接使用一阶谓词逻辑FOL、描述逻辑等方式对专家制定的规则进行表示及推理。基于逻辑的推理方法又分为基于一阶谓词的推理和基于描述逻辑的推理。
基于一阶谓词逻辑的推理是指一阶谓词逻辑对专家预定好的规则进行表示,然后以命题为基本单位进行推理。命题包括个体和谓词,个体对应知识图谱中的实体,谓词对应知识图谱中的关系。
基于描述逻辑的推理关键在于将知识图谱中的复杂实体或关系推理转换成一致检测问题,有效降低了知识图谱模型的推理复杂度,取得了表达能力和推理复杂度的平衡。使用描述逻辑表示的知识图谱由术语集和断言集组成,TBox包含描述概念和关系的一系列公理,ABox中包含TBox中概念的实例。基于描述逻辑的推理方法通过确定一个描述是否满足逻辑一致性,实现知识图谱推理。
1.1.2 基于统计的推理
基于统计的推理关键在于利用机器学习方法,从知识图谱中自动挖掘出隐含的逻辑规则,并将这些规则用于推理。基于统计的推理方法分为基于归纳逻辑编程的推理和基于关联规则挖掘的推理。
基于归纳逻辑编程的推理是指使用机器学习和逻辑编程技术,在知识图谱上自动归纳出抽象的规则集,以完成推理。其优点是摒弃了人工定义规则的模式,在小规模的知识图谱上具有较好的推理能力。
基于关联规则挖掘的推理关键在于从知识图谱中自动挖掘出高置信度的规则,并利用这些规则在知识图谱上推理以得到新的知识。其优点是可以处理更复杂、更庞大的知识图谱,且规则挖掘速度更快。
1.1.3 基于图结构的推理
基于图结构的推理是利用图谱的结构作为特征完成推理任务。其优点是推理效率高且可解释。
(1)基于全局结构的推理
基于全局结构的推理是指对整个知识图谱进行路径提取,然后将实体之间的路径作为特征用于判断实体间是否存在目标关系。其优点是可以自动挖掘路径规则且具有可解释性。
(2)引入局部结构的推理
基于局部结构的推理是指利用与推理高度相关的局部图谱结构作为特征进行计算,以实现知识图谱的推理。其优点是特征粒度更细且计算代价低。
类型 | 具体方法 | 核心思路 | 存在问题 |
基于逻辑的推理 | 基于一阶谓词逻辑的推理 | 使用一阶谓词逻辑表示规则,以命题为基本单位进行推理 | 依赖专家定义的规则;计算复杂度高 |
基于描述逻辑的推理 | 使用描述逻辑表示规则,将实体或关系推理转换成一致检测问题 | 依赖专家定义的规则;计算复杂度高 | |
基于统计的推理 | 基于归纳逻辑编程的推理 | 使用机器学习和逻辑编程,在知识图谱上自动归纳出抽象规则集以完成推理 | 穷举搜索计算开销大 |
基于关联规则挖掘的推理 | 通过从知识图谱中自动挖掘出高置信度规则,并利用这些规则完成推理 | 规则学习搜索空间大,效率低;挖掘规则覆盖率低,预测效果差 | |
基于图结构的推理 | 基于全局结构的推理 | 通过对整个知识图谱进行路径提取,将实体之间的路径作为特征以完成推理 | 路径提取效率低难以处理关系稀疏的数据 |
引入局部结构的推理 | 利用与推理高度相关的局部图谱结构作为特征进行计算,实现知识图谱推理 | 忽略局部子图间关系,挖掘的路径规则覆盖率低 |
图1 基于逻辑规则的知识推理方法对比
1.2 基于嵌入表示的知识图谱推理
在机器学习中,嵌入表示就是将复杂的数据结构转化为向量化的表示。知识图谱中嵌入表示可以使原本难以发现的关联关系变得显而易见。
1.2.1 张量分解方法
张量分解方法是通过特定技术将关系张量分解为多个矩阵,利用这些矩阵可以构造出知识图谱的一个低维嵌入表示。
1.2.2 距离模型
距离模型又称平移模型,该类模型将知识图谱中每个关系看作从主体向量到客体向量的一个平移变换,通过最小化平移转化的误差,将知识图谱中的实体和关系映射到低维空间。
1.2.3 语义匹配模型
语义匹配模型通过设计基于相似度的目标函数,在低维向量空间匹配不同实体和关系类型的潜在语义,定义基于相似性的评分函数,度量一个关系三元组的合理性。其认为有关系的三元组应该具有较高的相似度,没有关系应该具有较低的相似度。
类型 | 具体方法 | 核心思路 | 存在问题 |
张量分解方法 | RESCAL及其改进 | 利用已有张量分解算法,分解三阶关系张量,高效计算嵌入表示 | 方法较为简单,效果有限,可解释性较弱 |
距离模型 | 简单平移模型 | 将关系解释为向量空间平移变换,对嵌入表示进行优化计算 | 平移转化要求严格,难以对抗噪声,且无法处理非一对一关系 |
松弛化平移模型 | 对简单平移模型加以松弛化处理,允许平移转化为一定的偏差 | 松弛化程度难以把控,导致模型有效性降低 | |
投影空间平移模型 | 分离实体空间和关系空间,在投影空间进行平移转化的计算 | 跨空间投影运算开销较高,参数数量较多,模型训练难度大 | |
语义匹配模型 | 线性语义分配 | 进行二元和三元的语义匹配,构建线性优化目标 | 线性模型结构难以捕捉非线性语义关系 |
神经网络的语义匹配 | 利用深度神经网络,实现对非线性语义关系的学习 | 神经网络模型训练开销大,可解释性不足 |
图2 基于嵌入表示的知识图谱推理方法对比
1.3 基于神经网络的知识图谱推理
基于神经网络的知识图谱推理,充分利用了神经网络对非线性复杂关系的建模能力,可以深入学习图谱结构特征和语义特征,实现对图谱缺失关系的有效预测。
1.3.1 卷积神经网络方法(CNN)
基于CNN的知识图谱推理方法,是通过卷积操作提取知识局部特征,预测图谱中的缺失关系,包括基于实体文本描述的推理和基于实体关系交互的推理两大类。
(1)基于实体文本描述的推理
其方法为利用卷积神经网络方法对实体文本描述进行解析,从中提取出关键的文本片段并转换为嵌入向量,进而利用文本特征辅助对实体语义的准确理解。
(2)基于实体关系交互的推理
其方法为利用卷积神经网络对实体关系嵌入向量拼接而成的二维矩阵执行卷积操作,从中提取出实体、关系语义的交互信息,进而提升对知识三元组结构语义的理解。
1.3.2 循环神经网络方法(RNN)
基于RNN的知识图谱推理方法指基于循环结构提取知识序列特征,预测图谱中的缺失关系,主要包括基于知识路径语义的推理和基于实体文本描述的推理两大类。
(1)基于知识路径语义的推理
知识路径指知识图谱中由实体关系交替组成的有序路径,其中蕴含了从起点实体到终点实体间的隐藏语义。基于知识路径语义的RNN推理指利用RNN结构特征,迭代学习路径的语义特征,从中发现关联路径上的隐含语义信息,并基于此实现缺失知识的准确预测。
(2)基于实体文本描述的推理
其方法为利用循环神经网络依次读入实体文本描述信息,完成不同三元组中实体语义信息的匹配,从而实现对缺失知识的准确预测。
1.3.3 图神经网络方法
基于图神经网络方法的知识图谱推理方法指基于图神经网络提取出图谱拓扑结构特征,预测图谱中的缺失关系,主要包括基于图神经网络的推理与基于图注意力网络的推理两大类。
(1)基于图神经网络(GCN)的推理
图神经网络引入傅里叶变换,将图结构信息变换到由图拉普拉斯矩阵特征向量构成的正交空间中,从而实现邻域向中心的信息聚合。
(2)基于图注意力网络(GAT)的推理
图注意力网络是一种基于空间结构的图神经网络,在聚合邻域特征信息时,通过注意力机制确定邻居节点权重信息,从而实现邻域对中心贡献程度的自适应调节。
1.3.4 深度强化学习方法(DRL)
基于深度强化学习的知识图谱推理方法,结合了深度学习对图谱结构的感知能力与强化学习及对补全关系的决策能力,将图谱上的推理建模为序列决策模型。
基于关系路径探索的推理将知识实体、邻接关系分别构建为状态空间和行动空间,采用实体游走进行状态转换,发现正确答案即生成奖励。从而基于“关系-路径-探索”建立推理方案,能显著提升知识推理的有效性和多样性。
具体类型 | 具体方法 | 核心思路 | 存在问题 |
卷积神经网络方法 | 基于实体文本描述的推理DKRL、ConMask等 | 对实体文本描述执行卷积操作 | 只关注文本语义局部特征 |
基于实体关系交互的推理ConvE、InteractE等 | 对知识三元组嵌入执行卷积操作 | 忽略了三元组间的语义关联 | |
循环神经网络方法 | 基于知识路径语义的推理Sing-Model、DSKG等 | 迭代分析知识图谱关系路径 | 记忆遗忘、忽略路径之间的语义关联;严重依赖文本的数量及质量 |
基于实体文本描述的推理KGDL、T-CRNN等 | 迭代分析实体文本描述 | 严重依赖文本的数量及质量 | |
图神经网络方法 | 基于图神经网络的推理SACN、R-GCN等 | 基于无向边实现邻域到中心的汇聚 | 简单地把单向关系建模为双向关系,建模方向存在误差 |
基于图注意力网络的推理DPMPN、ReInceptionE等 | 基于有向边实现邻域到中心的汇聚 | 考虑更多跳数的邻域时存在过平滑问题 | |
深度强化学习方法 | 基于关系路径探索的推理DeepPath、MINERVA等 | 基于知识图谱实体关系拓扑结构构建强化学习环境 | 稀疏奖励、难以适应动态增长的图谱 |
图3 基于神经网络的知识图谱推理方法对比