延迟建模相关paper


Asymptotically Unbiased Estimation for Delayed Feedback Modeling via Label Correction

组织:阿里

摘要: 缓解延迟反馈问题对于在线广告中的转化率(CVR)预测至关重要。以往的延迟反馈建模方法使用一个观察窗口来平衡等待准确标签与消费新鲜反馈之间的权衡。此外,为了在包含假阴性样本的新鲜但存在偏差的观测分布上估计CVR,重要性采样被广泛用于减少分布偏差。虽然有效,但我们认为先前的方法错误地将假阴性样本视为真实阴性样本进行处理,并且未能充分利用已观测到的阳性样本,导致次优性能。 在本工作中,我们提出了一种新方法 DElayed Feedback modeling with Unbiased Estimation (DEFUSE)。该方法旨在以更细的粒度分别校正即时阳性样本 (immediate positive)、假阴性样本 (fake negative)、真实阴性样本 (real negative) 和延迟阳性样本 (delay positive) 的重要性权重。具体来说,我们提出了一种两步优化方法:首先在应用重要性采样之前推断观测阴性样本中假阴性的概率。为了充分利用观测分布中的真实即时阳性样本,我们进一步开发了一个双分布建模框架 (bi-distribution modeling framework),以联合建模无偏的即时阳性和有偏的延迟转化。在公开数据集和我们工业数据集上的实验结果验证了DEFUSE的优越性。代码可在 https://github.com/ychen216/DEFUSE.git 获取。


Ensure Timeliness and Accuracy: A Novel Sliding Window Data Stream Paradigm for Live Streaming Recommendation

组织:快手

摘要: 实时流媒体推荐系统旨在为用户动态推荐其感兴趣的直播内容。由于直播内容持续动态变化,提升推荐系统的时效性成为关键挑战。直观而言,数据的时效性决定了模型学习效果的上限。然而,现有研究尚未从数据流设计的角度解决直播推荐的时效性问题。传统固定窗口数据流范式需在标注准确性与时效性之间权衡:缩短窗口可提升时效性,但会因延迟反馈导致标注失真。 本文提出一种名为 Sliver 的新型数据流范式,通过缩小窗口尺寸并采用滑动窗口机制,同步解决时效性与标注准确性问题。同时,我们提出一种时间敏感的“重推荐”(re-reco)策略,通过周期性请求推荐服务,减少用户请求与内容曝光之间的延迟,从而提升推荐服务与特征的时效性。 为验证方法的有效性,我们在快手直播平台的多任务数据集上进行离线实验(标注含时间戳)。结果表明,Sliver 在四种典型多任务推荐模型中,均优于不同窗口尺寸的固定窗口数据流。此外,Sliver 已在快手直播平台在线部署,A/B 测试显示点击率(CTR)提升 6.765%–8.304%,新增关注数(NFN)提升 2.788%–3.697%,进一步验证了其有效性。