南京大学PASA大数据实验室论文被国际数据挖掘顶级会议KDD 2022录用

近日,南京大学PASA大数据实验室在推荐系统中自动化黑盒攻击样本生成的工作 “Knowledge_enhanced_Black_box_Attacks_for_Recommendations”被数据挖掘领域国际顶级会议 KDD 2022 Research Track 长文录用,该工作基于图神经网络和深度强化学习,研究提出了一种推荐系统中知识增强的自动化黑盒攻击样本生成方法。论文第一作者为南京大学PASA大数据实验室研究生陈竞帆同学,论文指导教师为实验室朱光辉老师。

第28届国际知识发现与数据挖掘大会

ACM SIGKDD(国际知识发现与数据挖掘大会,简称KDD)会议始于 1989 年,是数据挖掘领域历史最悠久、规模最大的国际顶级学术会议,也是中国计算机学会(CCF)推荐的A类学术会议,至今已成功举办27届。今年的 KDD 大会是第 28 届,预计将于 8 月中旬在美国华盛顿特区举办。KDD 2022 Research track 共收到 1695 篇投稿,其中 254 篇被接收,接收率为 14.9%。

深度神经网络技术已被广泛用于提升推荐系统的推荐性能。最近的研究表明,大多数现有的基于深度学习的推荐系统也容易受到恶意攻击。攻击者可以精心生成虚假用户记录(即一组刻意构造的虚假用户交互过的商品序列),并将其注入目标推荐系统,从而攻击(比如推广)若干潜在的目标商品。出于对隐私和安全方面的考虑,与需要完全或部分了解目标推荐系统的白盒和灰盒攻击相比,在推荐系统中进行黑盒攻击更贴合实际。黑盒攻击可以通过查询某些特定的用户反馈来学习虚假用户记录的生成策略,以便对推荐系统进行攻击。然而,现有的推荐系统攻击模型忽略了商品之间潜在的语义关联,导致攻击推荐系统时得到次优的性能。为此,本工作研究提出了一种知识增强的自动化黑盒攻击样本生成方法。首先,通用引入外部知识图谱并利用图神经网络实现知识增强的商品表征学习。然后,将攻击样本的自动化生成建模为一种深度强化学习问题。为了提升大规模候选商品空间下的攻击样本生成效率,进一步研究提出了层级策略网络模块。在真实数据集中的大量实验结果表明,本工作研究提出的基于图神经网络和强化学习的黑盒攻击框架能够自动生成高质量的虚假用户记录,从而实现的目标推荐系统的黑盒攻击,对提升推荐系统模型的鲁棒性具有很好的指导意义。

算法总体流程图

此次论文入选KDD 2022,是PASA大数据实验室在AutoML自动化机器学习、图神经网络以及推荐系统领域持续深耕和不断创新的又一成果。除此之外,PASA大数据实验室还积极参加素有“数据世界杯”之称的KDD Cup国际挑战赛。在KDD Cup 2019的AutoML Track中荣获TOP-10优胜奖(国际第八名,全球860支队伍,获邀在KDD 2020线上会议上做技术分享);在KDD Cup 2020的AutoGraph自动化图数据建模竞赛中荣获国际第二名(全球220多支队伍,相关工作已被数据库与数据管理领域国际顶会ICDE 2022长文录用)。

CUP 国际大赛获奖