阿里妈妈技术团队 5 篇论文入选 TheWebConf 2022
近日,第31屆國際萬維網大會(The Web Conference / WWW)審稿結果出爐, 阿里媽媽技術團隊有5篇論文入選。
TheWebConf 成立于1989年,原名為“The International World Wide Web Conference (WWW)”,于2018年正式更名為“The Web Conference, TheWebConf”。至今已成功舉辦30屆,是網絡系統與應用交叉領域的頂級學術會議,也被列為《中國計算機學會推薦國際學術會議和期刊目錄》中交叉/綜合/新興類的A類學術會議(CCF A類)。今年會議將于4月25-29日在法國里昂以線上會議形式召開。本屆會議共收到1822篇長文投稿,其中有323篇長文被接收,接收率約為17.7%。
阿里媽媽論文概述
接下來為大家介紹阿里媽媽技術團隊入選論文,后續我們將邀請論文作者詳細解析論文思路和技術成果,歡迎關注~
? Asymptotically Unbiased Estimation for Delayed Feedback Modeling via Label Correction
基于實時樣本回補與label修正的無偏CVR延遲反饋建模
摘要: 在廣告場景中,CVR預估同時作為排序機制與CPC、oCPX等多種出價策略的基礎模塊,承擔著平臺效益與廣告主ROI兼顧、保持電商廣告平臺健康發展的重要職能。同時,為了使模型能夠快速適應流量的實時變化,提升模型的預估能力,商業系統中通常以在線學習的方式實時更新模型。然而,在線學習場景下,成交普遍存在的、顯著的延遲反饋現象將更加嚴重,進一步提升了CVR預估的難度。業界主流的CVR延遲反饋建模方法通常引入一個觀測窗口來平衡label準確性和樣本時效性,并設計不同的樣本回補機制來充分利用稀疏的各類反饋信號,最后應用重要性采用來消除觀測分布和真實分布上的偏差。但現有方法在應用重要性采用的過程中都錯誤地將假負樣本當做真負樣本進行處理,導致實際上有偏的建模。我們提出了DEFUSE方法(DElayed Feedback modeling with UnbiaSed Estimation),將觀測樣本劃分為4種類型,在此基礎上優化了重要性采用的推導和應用方式,通過在4類樣本上更細粒度地應用重要性采樣,實現了CVR延遲反饋的無偏建模。針對歸因周期較小的場景,我們提出了一種基于觀測窗口內外成交獨立建模的Bi-DEFUSE方案,將CVR預估拆分為兩個子任務,充分利用了無偏的窗口內分布進行建模,并采用多任務學習框架實現了聯合訓練。詳盡的離線實驗充分驗證了DEFUSE、Bi-DEFUSE設計思路的合理性,取得了相對業界主流方案更加顯著的收益。目前,該建模方案已在阿里媽媽搜索廣告主場景全量上線,取得了顯著的在線效果。
? UKD: Debiasing Conversion Rate Estimation via Uncertainty-regularized Knowledge Distillation
CVR預估模型去偏:基于不確定性約束的知識蒸餾
摘要: 轉化率 (Post-click Conversion Rate, CVR) 預估是廣告/推薦系統中的一項重要任務。傳統 CVR 模型通常在點擊空間中訓練,由于在線服務時需在曝光空間中推理,模型性能受限于訓練/推理空間不一致的樣本選擇偏差問題 (Sample Selection Bias, SSB),而已有的全空間 CVR 模型均未充分利用未點擊樣本。為緩解 SSB 問題,我們從未點擊樣本中提取知識,提出基于不確定性約束的知識蒸餾框架 UKD (Uncertainty-Regularized Knowledge Distillation) 實現全空間 CVR 預估,其包含一個點擊自適應的教師模型和一個不確定性約束的學生模型。教師模型借鑒領域自適應的方式,學習曝光樣本的點擊自適應表示并生成未點擊樣本的偽轉化標簽。生成偽標簽后,學生模型利用點擊樣本和未點擊樣本進行全空間訓練。同時,學生模型引入不確定性建模偽標簽中的固有噪聲,在蒸餾過程中自適應地削弱噪聲的影響以取得更優的預估效果。在多個外投廣告場景上的實驗結果表明 UKD 優于以往的去偏方法,在線實驗進一步驗證了 UKD 在 CVR、CPA 指標上獲得了顯著提升。
論文下載:https://arxiv.org/abs/2201.08024
? MBCT: Tree-Based Feature-Aware Binning for Individual Uncertainty Calibration
MBCT:基于樹模型的特征可感知的個性化校準方法
摘要: 概率預估(如點擊率,轉化率)是搜索推薦和計算廣告領域的核心技術之一。以廣告場景為例,概率預估的準確性會直接影響平臺對每條流量的價值判斷, 繼而影響流量的分配與計費,相比于搜索推薦場景更關注預估模型的排序能力,廣告場景對預估的絕對值準確性有著更高的訴求。但是目前大多數預估模型主要在優化分類的準確性,而不是概率值的大小。因此,學者們提出了校準算法來對預估模型的輸出概率進行修正。現有的校準方法主要可分為分箱(Binning)和縮放(Scaling)兩類。其中分箱方法已經被證明在分布無關的假設下校準效果具有充分的誤差保證,所以我們也考慮延續分箱校準方法進行算法優化。現有分箱校準方法存在兩個主要缺點:a)分箱方案只考慮模型原始預估值,即僅根據預估值大小進行分箱和校準,嚴重限制了效果天花板;b) 分箱校準是非個性化的,會將一個分箱中的所有樣本校準成相同的值,不適用于對排序能力敏感的計算廣告領域。我們提出了一個特征可感知的分箱校準框架(Feature-Aware Binning Framework),通過樹結構算法學習原始模型在特征空間上的誤差范式來優化預估誤差,簡稱MBCT(Multiple Boosting Calibration Trees)。我們在樹的每個節點中應用線性函數進行校準系數映射,實現了單樣本粒度的個性化校準能力。由于MBCT方法是非保序的(即預估值與校準值不嚴格保序),具備進一步優化預估值排序效果的空間。我們選擇了三個不同應用領域的數據集進行驗證,結果表明MBCT在校準誤差和排序效果優化方面均表現出明顯的優勢。此外,我們還設計了一個全新的校準評價指標MVCE(Multi-view Calibration Error),從多維度視角全面度量校準誤差,多組仿真實驗表明MVCE是目前進行校準效果度量的最優指標。目前,MBCT部署在阿里媽媽展示廣告平臺中,取得了顯著的業務收益。
? On Designing a Two-stage Auction for Online Advertising
在線廣告兩階段拍賣機制設計
摘要:?在線廣告拍賣機制通過設計分配和扣費機制來優化社會福利、收入等指標。學術界通常假定廣告系統經過一次拍賣就可以在所有的參競廣告上得到最終的分配結果。但工業界在線廣告系統廣泛采用兩階段的拍賣架構,在前序拍賣時通常采用復雜度低的預估模型和機制策略初選廣告候選集,并在后續階段通過精細且復雜度高的預估模型和機制策略來確定最終拍賣結果。這樣的架構為了保證滿足在線廣告系統的時效性要求,但是可以發現這兩階段的決策過程是相互獨立的,實際上前序拍賣結果的質量會顯著影響到后續拍賣的效果,因此這種直觀的兩階段拍賣機制在效果上并非最優的。在本文中,我們研究了兩階段架構中前序和后序預估模型及機制策略的關系,并通過考慮兩個階段間的決策交互來設計一個兩階段協同廣告拍賣機制。通過在前序拍賣階段解決隨機子集選擇問題并在后序階段使用廣義二價拍賣來重建兩階段拍賣的關聯,并證明了這種模式仍然保持了拍賣機制的激勵兼容性。由于前序拍賣階段的建模是一個NP計算難題,通過定義一個新的子集選擇指標,即預拍賣分數 (PAS),提出了一種可擴展的近似解決方案。在公共和工業數據集上的實驗結果表明,與直觀的兩階段拍賣和其他基線相比,本文提出的兩階段廣告拍賣機制在社會福利和收入等指標上有顯著提升。
論文下載:?https://arxiv.org/abs/2111.05555
? DC-GNN: Decoupled Graph Neural Networks for Improving and Accelerating Large-Scale E-commerce Retrieval
DC-GNN:面向大規模廣告召回場景的解耦式圖模型方法
摘要:?在大規模廣告召回場景中,圖神經網絡(GNN)由于其強大的拓撲特征提取和關系推理能力成為最先進的技術之一。大規模廣告召回場景通常包含了數十億量級的商品和數百億量級的交互關系,導致傳統的基于GNN的召回方法訓練效率低。在訓練效率的限制下,通常只能應用淺層的圖模型算法,這極大限制了圖模型的表達能力,從而降低了廣告召回的質量。為了提升訓練效率以及圖模型表達能力,我們提出了解耦式圖模型方法(DC-GNN)以改進和加速基于GNN的大規模廣告召回。DC-GNN主要包含三個階段:預訓練(Graph Pre-training)、深度聚合(Deep Aggregation)與雙塔CTR預估。具體來說,預訓練階段設計有監督的邊預測任務(Link Prediction)和自監督的圖多視野對比學習任務(Multi-view Graph Contrastive Learning)相結合的多任務學習來重點學習圖節點屬性信息,同時有效增強GNN魯棒性;深度聚合階段利用異構線性圖算子(Heterogeneous linear diffusion graph operators)進一步高效挖掘圖深層結構信息來增強圖節點的向量化表達;雙塔CTR建模階段將前兩個階段生成的節點向量化表達作為輸入,獲取預估分數以進行廣告召回。DC-GNN通過將雙塔CTR預估和圖操作進行解耦,使得訓練復雜度獨立于圖結構,有效提升了訓練效率。同時,深層聚合階段允許更深層次的圖操作以挖掘高階圖結構信息,從而有效提升了模型的表達能力。大規模工業數據集實驗表明,本文所提的DC-GNN方法在大規模廣告召回場景下模型性能和訓練效率都獲得了顯著提升。
END
也許你還想看
丨阿里媽媽技術團隊4篇論文入選WSDM 2022
丨阿里媽媽技術團隊 6 篇論文入選 CIKM 2021
丨KDD2021 放榜,6 篇論文帶你了解阿里媽媽AI技術
歡迎關注「阿里媽媽技術」,了解更多~
瘋狂暗示↓↓↓↓↓↓↓
總結
以上是生活随笔為你收集整理的阿里妈妈技术团队 5 篇论文入选 TheWebConf 2022的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: WSDM 2022 | 合约广告自适应统
- 下一篇: 【阿里妈妈营销科学系列】第七篇:目标群组