祝贺我组在自动化推荐系统的工作NAS-CTR被国际信息检索顶级会议SIGIR 2022(CCF A类会议)录用!
近日,南京大学PASA大数据实验室在自动化推荐系统(Automated Recommendation System,简称AutoRec)方向的论文“NAS-CTR: Efficient Neural Architecture Search for Click-Through Rate Prediction”被信息检索领域国际顶级会议 SIGIR 2022 长文录用,该论文是AutoML自动化机器学习与推荐系统两方面交叉融合的研究探索,研究提出了一种高效可微的方法用于点击率(Click-Through Rate,CTR)预估模型的架构搜索。论文工作主要由PASA大数据实验室研究生程锋完成,指导教师为朱光辉博士。
SIGIR 2022会议的全称是45th International ACM SIGIR Conference on Research and Development in Information Retrieval,(第45届ACM国际信息检索大会),将于2022年7月11日-7月15日在西班牙首都马德里召开。SIGIR是中国计算机学会CCF推荐的A类国际学术会议,也是人工智能领域智能信息检索方向最权威的国际会议。这次会议共收到794篇长文投稿,仅有161篇长文被录用,录用率约20%。
作为推荐系统中最具代表性的任务之一,点击率预估已被广泛应用于许多机器学习任务中,如在线广告以及定制化推荐。然而,给定特定领域的CTR数据集,从巨大的搜索空间中寻找最佳的特征交互操作以及操作之间的组合关系需要大量的专家经验和计算开销。近年来,神经网络架构搜索(Neural Architecture Search,NAS)技术在自动设计性能优异的网络架构方面取得了很大成功。但是,由于特征交互操作以及操作组合关系的多样性,已有的将架构搜索视为黑盒优化的方法计算效率较低。为此,论文针对点击率预估场景,研究提出了一种高效可微的架构搜索方法,简称NAS-CTR。首先,研究设计了一种新颖的而且表达力强的点击率预估模型架构搜索空间。为了实现可微的架构搜索,进一步将离散的搜索空间进行连续化。其次,将架构搜索抽象为带有约束限制的联合优化问题,实现网络权重和架构参数的联合优化。然后,采用近端迭代算法求解该联合优化问题。大量实验结果表明,与目前人工设计的最优CTR预估模型以及已有的NAS方法相比,本论文工作提出的方法NAS-CTR能够取得更加优异的模型预测性能和较高的搜索效率。
除了本论文外,PASA大数据实验室另外一篇自动化推荐系统方向的论文“AutoGSR: Neural Architecture Search for Graph-based Session Recommendation”也被SIGIR 2022长文录用。此次两篇论文同时入选 SIGIR,是PASA大数据实验室长期以来在AutoML自动化机器学习领域持续深耕的成果,也是在AutoML自动化机器学习与推荐系统两方面交叉融合的探索研究成果。