Learning to Expand Audience via Meta Hybrid Experts and Critics for Recommendation and Advertising
Yongchun Zhu, Yudan Liu, Ruobing Xie, Fuzhen Zhuang, Xiaobo Hao, Kaikai Ge, Xu Zhang, Leyu Lin and Juan Cao
Chinese Academy of Sciences, Beihang University, Tencent
https://dl.acm.org/doi/pdf/10.1145/3447548.3467093
在推荐系统和广告平台中,广告营销人员通常会在多个媒体渠道对潜在受众发布产品、内容或者广告,这里的渠道包括视频或者社交软件等。
给定一系列受众或消费者,即种子用户,人群扩展算法,即lookalike模型,对于识别高潜受众,是一个不错的解决方案。这里的高潜受众即为跟种子用户比较相似的,并且很有可能会完成目标活动的商业目标。
但是,lookalike模型面临两个挑战,其一,实际应用中,公司每天可以运行数以百计的营销活动,这些活动的内容多种多样,并且类别也完全不同,比如体育、政治、社会等。因此,利用通用方法对所有活动进行人群扩散比较困难。其二,特定活动的种子集合只会覆盖有限的用户,因此,基于此种子集合的定制化方法很有可能会过拟合。
这篇文章中,为了解决上述两个挑战,作者们提出一种新的二阶段框架,即元混合专家及判别,该框架已经部署在微信lookalike系统中。在离线阶段,生成式模型可以捕捉多种任务之间的关系,该模型是在所有现有营销任务中利用元学习角度来训练的。在线上阶段,对于新的营销活动,基于生成式模型和给定的种子用户集合,可以学习定制化模型。
离线和在线实验表明,所提方法,MetaHeac在内容营销活动的推荐系统中取得了较好的效果,同时在广告平台中的广告营销中也取得了很好的效果。
很多营销活动的种子用户都是很少的,只有几百个
该论文作者认为现有二阶段(offline + online)方法的不足有以下三点
MetaHeac主要基于以下两个想法
这篇文章的主要贡献如下
微信lookalike系统结构图示如下
微信lookalike系统中模型的训练周期、更新周期及召回耗时信息如下
作者们所提模型基于元学习的思想,元学习可以完成以下目标
人群扩展可以分为以下两个步骤
其中理解阶段简介及目标函数形式如下
从元学习的角度训练MetaHeac算法伪代码如下
作者们提出任务驱动的混合专家算法
作者们还提出了任务驱动的多判别家方法
模型整体结构图示如下
数据集信息简介如下
数据集信息统计如下
正负样本比设置如下
参与对比的方法分为以下三大类
实验参数设置如下
作者们采用了以下评估指标
几种方法的效果对比如下
线上ab效果统计如下
为验证各个部分的有效性,作者们进行了消融实验,效果如下
几种模型的收敛速度对比及作者们所提模型表示图示如下
基于规则和基于相似度的人群扩展方法简介如下
基于模型的方法也可以用于人群扩展
代码地址
https://github.com/easezyc/MetaHeac
我是分割线
您可能感兴趣
KDD2020|阿里提出多目标优化保量算法并用于优酷视频服务平台
KDD2020|腾讯联合中科大提出请求级别保量广告计划RAP
KDD2020|阿里联合香港理工大学提出多任务多视角图表示学习框架M2GRL(已开源)
KDD2020|字节联合密歇根州立大学提出推荐广告联合训练框架RAM(已开源)
KDD2020|阿里联合清华提出多兴趣框架ComiRec用于序列推荐(已开源)
KDD2020|京东提出图像类别卷积神经网络CSCNN用于视觉感知CTR预估
亚马逊联合纽约州立大学提出元学习算法MetaBridge用于电商有限标注数据情况下自动验证文本属性
KDD2020|腾讯基于app使用行为提出AETN用于构建通用型user-embedding(已开源)
KDD2020|阿里联合武大提出对偶异构图注意力网络DHGAT用于提升长尾商铺搜索效果
KDD2020|蚂蚁金服提出人群扩展算法Hubble用于智能营销
深度神经网络在Youtube推荐中的应用–开篇作之一–含部分实用技巧
BERT深层双向Transformers预训练在语言理解中的应用
原文始发于微信公众号(机器学习blog):KDD2021|腾讯联合中科院北航提出人群扩展算法MetaHeac并用于推荐和广告领域(已开源)