南京大学PASA大数据实验室论文被国际信息检索和数据挖掘顶级会议SIGIR 2024(CCF A类会议)录用

近日,南京大学PASA大数据实验室在动态异质图学习方向的论文“LLM-enhanced Cascaded Multi-level Learning on Temporal Heterogeneous Graphs”被信息检索和数据挖掘领域国际顶级会议 SIGIR 2024 长文录用,该论文针对动态异质图的表征学习任务,开创性地提出了一种基于大模型增强的多层级联学习方法。论文工作主要由PASA大数据实验室研究生王凤仪完成,指导教师为朱光辉博士。

SIGIR 2024会议的全称是47th International ACM SIGIR Conference on Research and Development in Information Retrieval,(第47届ACM国际信息检索大会),将于2024年7月14日-7月18日在美国首都华盛顿召开。SIGIR是中国计算机学会CCF推荐的A类国际学术会议,也是人工智能领域智能信息检索方向最权威的国际会议。这次会议共收到791篇长文投稿,仅有159篇长文被录用,录用率约20.1%。

动态异质图学习广泛应用于各类信息检索和图数据挖掘任务,然而现有的动态异质图学习仅考虑节点层面的表征学习,忽略了节点类型以及图类型层面的表征学习。不同领域的图以及同一个图内部的不同节点类型均呈现出特有的演化模式。为此,本工作提出了一种多层级联的动态异质图学习模型,能够有效捕获节点、节点类型以及图类型的演化信息。另外,本文通过引入大模型所包含的外部知识,提升节点类型以及图类型的表征质量。实验结果表明,本工作提出方法在性能、训练效率、可扩展性等方面均能够显著优于已有的动态异质图模型。