论文精读-对比学习在知识感知的推荐方法中的应用

论文题目：Knowledge Graph Contrastive Learning for Recommendation

前言必读

推荐系统已日益成为向用户推荐感兴趣的项目并减轻许多在线服务中的信息过载的不可或缺的装置，从电子商务平台、视频网站到在线广告。传统的推荐系统存在数据稀疏和冷启动等问题，知识图谱中丰富语义信息和结构信息能够缓解数据稀疏和冷启动等问题，提高推荐的准确度。但前提需要高质量的知识图谱，若知识图谱中三元组的质量参差不齐，可能导致无法学习到高质量的知识表示，导致推荐模型效果较差。

本文认为现有 KG 感知推荐方法的有效性在很大程度上依赖于高质量的输入知识图谱，并且容易受到噪声扰动。主要面临两大难题：

1.知识图谱有大量噪声数据（项目和实体之间与主题无关的连接），导致用户偏好不准确。

从新闻事件中提取的关键实体 Zack Wheeler 是美国职业棒球大联盟 (MLB) 组织中费城费城人队的著名棒球投手。但是我们可以发现 Zack Wheeler 与两个项目（Smyrna，GA 和 UCL Reconstruction）语义无关的“嘈杂”实体相关联。虽然 Zack Wheeler 出生在Smyrna，GA（佐治亚州士麦那），并且他接受过尺侧副韧带 (UCL) 重建手术，但这两个实体与本新闻的主题不太相关，本新闻侧重体育新闻。

2、知识图谱中实体的长尾分布导致知识图谱增强项目表示的监督信号稀疏等问题。

在Yelp2018、Book、MIND三个数据集中，其知识图谱中实体的长尾分布图

我们将知识图谱质量问题和实体长尾发布问统称为 KG 噪声问题。这种数据噪声问题将从两个角度损害项目表示的质量：

i）局部来看，项目直接聚合来自低质量的实体信息会干扰项目的关键语义信息。

ii) 全局来看，知识图谱上的信息聚合很容易过度平滑，因为大量信息可以通过一些流行的实体（例如位置名称）传播到目标节点。例如，同样出生在乔治亚州士麦那的其他人可以与职业棒球投手——Zack Wheeler 联系起来。因此，有必要赋予知识图增强监督范式有效的连接去噪能力，以便提取目标用户的真实潜在偏好，并具有不受噪声干扰的表示。

为了解决上述存在的问题

本文提出了一个通用的知识图对比学习框架（KGCL）进行推荐。

具体来说，为了处理知识图谱中的关系异质性，首先提出了一种关系感知知识聚合机制来捕获用于项目表示的实体和关系相关的上下文信号。然后，开发了一种跨视图对比学习模式，在知识图谱执行对比学习来减小知识图谱的噪声，并将去噪后的KG与用户-项目交互建模联系起来，从而可以利用外部项目语义相关性来指导跨视图自监督信号的数据增强。

在KGCL框架中，联合对比学习和基于知识图谱结构一致性来丢弃不相关的三元组和相关项目，以实现稳定的学习用户偏好。

KGCL框架

KGCL的框架如图所示，由关系感知的知识聚合，知识图谱增强和知识引导的对比学习三部分组成。

关系感知的知识聚合

本文设计了一个关系感知的知识嵌入层，将项目、相关实体和项目-实体之间的关系映射到注意力矩阵中进行特定表示，从而建立了项目、实体、关系之间的信息聚合机制。

由公式1我们可以看出，对于项目i的表示有本身嵌入和项目链接的加权实体e组成，对应加权实体e，其采用注意力机制进行计算（本质就是GAT加入关系（re,j）。

知识图谱增强

我们知道对比学习其核心是数据增强，通过最大化增强视图之间的相互信息，达到减少不相关实体干扰。本文对知识图谱上采用随机数据增强方案来生成两个相关的数据视图。然后，输出单个项目的知识图谱结构一致性，以反映项目对知识噪声扰动的不变性。

在对知识图谱结构进行增强后，我们获得了两个视图。为了确保基于增强视图的每个项目的一致性属性，定义项目的知识图谱结构一致性ci与从不同视图编码的表示之间的一致性如下：

(·) 表示估计两视图的项目嵌入之间相似度的余弦函数。如果一个项目的结构一致性得分越高，表示项目受 KG 噪声的影响越大。

知识引导的对比学习

首先，对用户-项目图进行数据增强，采用伯努利分布来生成两个掩码向量，其p的概率=。计算过程如下所示：

其中 (·) 表示用户-项目交互图增强函数。根据(·)生成了两个用户-项目图和项目知识结构一致性来分别指导，并采用关系感知的知识聚合和LightGCN框架来获得项目i的高阶信息，其项目i的高阶信息获取过程如下：

最后，对比损失函数采用InfoNCE：

联合训练

将贝叶斯个性化排名（BPR）推荐损失与对比损失相结合进行联合优化

总结

本来采用关系感知的知识聚合来获得项目的嵌入（低阶），通过随机数据增强来获得两个相关数据视图，并对用户-项目图采用服从伯努利分布掩码矩阵生成两个腐蚀的用户-项目图。对两个用户-项目图采用关系感知的知识聚合和lightGCN来进行知识引导增强。

展开阅读全文

页面更新：2024-03-03

标签：知识图谱视图噪声实体两个关系方法项目数据用户论文

1 2 3 4 5

论文精读-对比学习在知识感知的推荐方法中的应用

论文题目：Knowledge Graph Contrastive Learning for Recommendation

前言必读

为了解决上述存在的问题

KGCL框架

关系感知的知识聚合

知识图谱增强

知识引导的对比学习

联合训练

总结

东北大学最新研究成果：超高强钢铁材料领域实现新突破

金观平：创新场景释放消费潜能

以坡头经济之“进” 支持湛江经济之“稳”

专访金晶集团董事长王刚-拥抱绿色趋势，作碳中和时代的冲锋者

国外企业看好中国春节消费力！上海港迎来密集进口渔船，超142吨鲜活帝王蟹抵运

2022年度全国中小企业特色产业集群名单公布江西5家上榜

十大出口强国排行榜，忍了一个世纪，现在只是拿回属于自己的位置

宜昌排在第七，赣州坐稳第二！中部地级市存款十强公布

通胀仍处高位美国民众对美经济形势感到悲观

成立新公司拆分马云表决权，支付宝母公司或想再次上市？

23年第二周基金收益

达泊智能 - 四载春秋，初心不忘，拾级而上

沈阳金杯宣布破产，华晨的未来仍扑朔迷离

内蒙古政协委员刘德建议：实施“骆驼产业振兴工程”提升绿色富农产业辐射带动效应

完美收官！它是CES2023上最亮眼的中国科技担当！

丰台布局智能建造“新赛道”，年内试点超十个智能建造项

华民股份光伏项目正式投产成功切入新能源材料赛道

两个人是“灵魂伴侣”，会产生以下默契

小电科技陷数据造假风波：不公布订单数、冻结渠道商资金

探访｜小米汽车工厂一期项目厂房已基本成型，部分工种春节

哈啰顺风车发单用户过亿：持续创造顺风出行好体验

投资几百亿，多个跟房地产相关项目退出广西重点推进建设

秃头掉发星人必备！教你4个方法，活学活用

50+21+11！CBA超级外援打出疯狂数据再创纪录，吉林21分大

继续保持！美媒晒灰熊近日战况多项数据联盟前二