推荐系统已日益成为向用户推荐感兴趣的项目并减轻许多在线服务中的信息过载的不可或缺的装置,从电子商务平台、视频网站到在线广告。传统的推荐系统存在数据稀疏和冷启动等问题,知识图谱中丰富语义信息和结构信息能够缓解数据稀疏和冷启动等问题,提高推荐的准确度。但前提需要高质量的知识图谱,若知识图谱中三元组的质量参差不齐,可能导致无法学习到高质量的知识表示,导致推荐模型效果较差。
本文认为现有 KG 感知推荐方法的有效性在很大程度上依赖于高质量的输入知识图谱,并且容易受到噪声扰动。主要面临两大难题:
1.知识图谱有大量噪声数据(项目和实体之间与主题无关的连接),导致用户偏好不准确。
从新闻事件中提取的关键实体 Zack Wheeler 是美国职业棒球大联盟 (MLB) 组织中费城费城人队的著名棒球投手。但是我们可以发现 Zack Wheeler 与两个项目(Smyrna,GA 和 UCL Reconstruction)语义无关的“嘈杂”实体相关联。虽然 Zack Wheeler 出生在Smyrna,GA(佐治亚州士麦那),并且他接受过尺侧副韧带 (UCL) 重建手术,但这两个实体与本新闻的主题不太相关,本新闻侧重体育新闻。
2、知识图谱中实体的长尾分布导致知识图谱增强项目表示的监督信号稀疏等问题。
我们将知识图谱质量问题和实体长尾发布问统称为 KG 噪声问题。这种数据噪声问题将从两个角度损害项目表示的质量:
i)局部来看,项目直接聚合来自低质量的实体信息会干扰项目的关键语义信息。
ii) 全局来看,知识图谱上的信息聚合很容易过度平滑,因为大量信息可以通过一些流行的实体(例如位置名称)传播到目标节点。例如,同样出生在乔治亚州士麦那的其他人可以与职业棒球投手——Zack Wheeler 联系起来。因此,有必要赋予知识图增强监督范式有效的连接去噪能力,以便提取目标用户的真实潜在偏好,并具有不受噪声干扰的表示。
本文提出了一个通用的知识图对比学习框架(KGCL)进行推荐。
具体来说,为了处理知识图谱中的关系异质性,首先提出了一种关系感知知识聚合机制来捕获用于项目表示的实体和关系相关的上下文信号。然后,开发了一种跨视图对比学习模式,在知识图谱执行对比学习来减小知识图谱的噪声,并将去噪后的KG与用户-项目交互建模联系起来,从而可以利用外部项目语义相关性来指导跨视图自监督信号的数据增强。
在KGCL框架中,联合对比学习和基于知识图谱结构一致性来丢弃不相关的三元组和相关项目,以实现稳定的学习用户偏好。
KGCL的框架如图所示,由关系感知的知识聚合,知识图谱增强和知识引导的对比学习三部分组成。
本文设计了一个关系感知的知识嵌入层,将项目、相关实体和项目-实体之间的关系映射到注意力矩阵中进行特定表示,从而建立了项目、实体、关系之间的信息聚合机制。
由公式1我们可以看出,对于项目i的表示有本身嵌入和项目链接的加权实体e组成,对应加权实体e,其采用注意力机制进行计算(本质就是GAT加入关系(re,j)。
我们知道对比学习其核心是数据增强,通过最大化增强视图之间的相互信息,达到减少不相关实体干扰。本文对知识图谱上采用随机数据增强方案来生成两个相关的数据视图。然后,输出单个项目的知识图谱结构一致性,以反映项目对知识噪声扰动的不变性。
在对知识图谱结构进行增强后,我们获得了两个视图。为了确保基于增强视图的每个项目的一致性属性,定义项目 的知识图谱结构一致性ci与从不同视图编码的表示之间的一致性如下:
(·) 表示估计两视图的项目嵌入之间相似度的余弦函数。如果一个项目的结构一致性得分 越高,表示项目 受 KG 噪声的影响越大。
首先,对用户-项目图进行数据增强,采用伯努利分布来生成两个掩码向量,其p的概率=。计算过程如下所示:
其中 (·) 表示用户-项目交互图增强函数。根据(·)生成了两个用户-项目图和项目知识结构一致性来分别指导,并采用关系感知的知识聚合和LightGCN框架来获得项目i的高阶信息,其项目i的高阶信息获取过程如下:
最后,对比损失函数采用InfoNCE:
将贝叶斯个性化排名(BPR)推荐损失与对比损失相结合进行联合优化
本来采用关系感知的知识聚合来获得项目的嵌入(低阶),通过随机数据增强来获得两个相关数据视图,并对用户-项目图采用服从伯努利分布掩码矩阵生成两个腐蚀的用户-项目图。对两个用户-项目图采用关系感知的知识聚合和lightGCN来进行知识引导增强。
页面更新:2024-03-03
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2008-2024 All Rights Reserved. Powered By bs178.com 闽ICP备11008920号-3
闽公网安备35020302034844号