Private Data Manipulation in Optimal Sponsored Search Auction
?
引言
搜索廣告拍賣(sponsored search auction)是搜索引擎向廣告主銷售搜索結果頁上的廣告位的一種拍賣活動。用戶每搜索一個關鍵詞,網頁的頂部和側面就可以顯示一些廣告。廣告每被點擊一次,相應的廣告主就需要向搜索引擎支付一筆費用。通常,廣告位不止一個,不同位置的廣告被用戶點擊的概率是不一樣的,而希望投放廣告的商家也不止一位。當多個廣告主競爭點擊率高的廣告位時,一場拍賣就出現(xiàn)了。
?
?
一個簡化的搜索廣告拍賣場景是這樣的:賣家(搜索引擎)出售?m?個廣告位,廣告位點擊率從大到小排序為?q1?≥ q2?≥ ? ≥ qm(假設點擊率與廣告的實際內容無關)。有?n?個買家(廣告主),每人至多購買一個廣告位,他們對每次點擊的估值為?v1,?v2, …, vn。估值?vi?只有買家?i?自己清楚,賣家和其他買家都不知道?vi?的值。買家們向賣家報價?bi?來代表他們的估值?vi。bi?不一定要等于?vi。賣家根據(jù)所有的報價?b1, b2, …, bn?來確定這?m?個廣告位如何分配給廣告主們以及每個廣告主應該為每次點擊支付多少費用?pi。假設買家?i?獲得了廣告位?j,則他的效用為?vi?qj?–?pi?qj,而賣家的收益即所有?pi?qj?的和。買家通過調整報價來最大化自己的效用,而賣家希望最大化收益。不同的分配方案?qj(?) 和費用計算方式?pi(?) 會影響買家的報價策略,也給賣家?guī)聿煌氖找妗?/p>
?
早在40年前,經濟學家 Roger B. Myerson 就設計出了賣家收益最優(yōu)的拍賣方案,稱為 Myerson's auction[1]。除了賣家收益最優(yōu),Myerson's auction 還具有 truthful 的性質,即買家的報價?bi?恰好等于估值?vi?時,他們的效用是最大的。這個貢獻是 Myerson 在2007年獲得諾貝爾經濟學獎的原因之一。
?
需要強調的是,Myerson's auction 依賴于經濟學中的一個經典假設:買家的估值?vi?服從某個概率分布?Fi,且包括賣家在內的所有人都知道這個分布。Myerson's auction 的分配方案和費用計算方式與分布?Fi?密切相關,也就是說,買家?i?獲得的廣告位?qj(?)?和他支付的費用?pi(?)?是同時關于報價 (b1, b2, …, bn) 和分布?(F1, F2, …, Fn)?的函數(shù)。
?
然而在現(xiàn)實中,“知道買家的估值分布”這一假設并不成立。不成立的原因有:完整的分布無法用計算機儲存、估值信息屬于廣告主的隱私等。因此,搜索引擎無法直接使用 Myerson's auction 來最大化自己的收益。
?
不過,與傳統(tǒng)經濟學中的拍賣不同的是,搜索廣告拍賣是重復的。關鍵詞每被搜索一次,就產生一場拍賣,這個過程一天能重復成千上萬次。如果一個買家參加多場拍賣,搜索引擎就可以通過他的歷史報價記錄來估計他的估值分布。如果報價數(shù)據(jù)足夠多,則賣家依然能使用 Myerson's auction 來獲得近似最優(yōu)的收益[2]。賣家收益增加通常意味著買家效用減少。換句話說,通過“大數(shù)據(jù)殺熟”,賣家能從買家身上榨取更多利潤。
?
但是買家甘心被宰嗎?大數(shù)據(jù)殺熟有一個前提:報價數(shù)據(jù)必須真實刻畫買家的估值分布。然而,當報價數(shù)據(jù)掌控在買家手中時,即使在 Myerson's auction 這樣原本滿足 truthful 性質的拍賣中,誠實報價?bi?= vi?也未必是納什均衡(納什均衡即每個參與者在其他參與者的策略不變的情況下采用了最優(yōu)策略的穩(wěn)定狀態(tài))。因為賣家對分配和付費方案的選擇與買家的分布有關,所以買家可以修改分布來影響賣家的決策,從而獲得更高的效用。這就是我們希望研究的問題:
?
若搜索引擎使用歷史報價來近似估值分布,
買家會采用怎樣的報價策略?
賣家的收益又如何?
?
模型和結果
我們考慮了一個理想化的兩階段模型:首先賣家公布一個拍賣方案?M,比如 Myerson's auction,M?的分配和付費計算方式可以與估值分布有關;然后買家們提交一組分布?F1', …, Fn',具體來說,買家?i?根據(jù)某個報價函數(shù)?βi: R+?→ R+?將估值?vi?~ Fi?映射到?bi?= βi?(vi),使得?bi?的分布服從?Fi'。買家?i?獲得的廣告位?qj?和支付的費用?pi?是由?(b1, …, bn)?和 (F1', …, Fn')?決定的。賣家的收益是?pi?qj?的和的期望,買家?i?的效用是?vi?qj??–?pi?qj?的期望。
?
在這個模型中,Fi?是買家的私有信息,而?Fi'?可被視為私有信息的代理。買家可以任意選擇代理。在代理和拍賣方式的選擇上,買家之間、買家與賣家之間形成了復雜的博弈關系。因此我們稱這個模型為“私有數(shù)據(jù)代理博弈”(論文中為“私有數(shù)據(jù)操縱博弈,Private Data Manipulation game,PDM”)。
?
在私有數(shù)據(jù)代理博弈模型下,我們證明了:
?
Myerson's auction 與 Generalized First Price auction 等價。
?
Generalized First Price auction(GFP)是單物品最高價拍賣(first price auction)在搜索廣告拍賣場景中的推廣:在 GFP 中,賣家將廣告主按照報價從高到低排序,不妨記為?b1?≥ ? ≥ bn,廣告位也按點擊率從高到低排序,q1?≥?? ≥ qm。分配方案是:廣告主1獲得廣告位1,廣告主2獲得廣告位2,以此類推,廣告主 min{n,?m} 獲得廣告位 min{n,?m};每個廣告主?i?為每次點擊支付的費用?pi?就等于他的報價?bi。與 Myerson's auction 不同的是,GFP 本身不 truthful,且它的分配方案和費用計算方式與估值分布無關。所謂“等價”,是說在私有數(shù)據(jù)代理博弈中,在 Myerson's auction 和 GFP 各自的納什均衡下,賣家獲得相同的期望收益,每個買家的期望效用也相同。換句話說,搜索引擎沒有必要從數(shù)據(jù)中還原分布后再運行所謂“收益最優(yōu)”的拍賣——運行一個與分布無關的拍賣就足夠了。這個等價性意味著:通過巧妙地選取代理分布,廣告主挫敗了搜索引擎的“剝削”行為,并在某些私有分布?Fi?下提高了自身的效用(比如?F1, …, Fn?獨立同分布時)。
?
Myerson's auction 與 GFP 等價的結論對任意一組分布?F1, …, Fn?都成立。進一步地,在給估值分布加一些限制條件(如獨立同分布)后,我們得出了 Myerson's auction 與 Generalized Second Price auction(GSP)和 VCG auction 也等價的結論(見Figure 1)。
?
討論
技術上,我們在經典的收益等價定理(revenue equivalence theorem)的基礎上,透過私有數(shù)據(jù)代理博弈這個新的視角,考察了 Myerson's auction 和 GFP、VCG、GSP 之間的等價性現(xiàn)象。我們還推廣了 Tang & Zeng [3] 的“Myerson's auction 與 GFP 在只有一個廣告位的拍賣中等價”的結論。
?
實際意義上,我們在重復的搜索廣告拍賣這個實際場景里,討論了機器學習中的激勵問題(incentives in machine learning)——當機器學習算法的輸出涉及訓練數(shù)據(jù)提供方的利益時,數(shù)據(jù)提供方可通過修改數(shù)據(jù)來獲利。我們相信私有數(shù)據(jù)代理博弈模型可以應用到其他實際問題。
?
參考文獻
[1]R. B. Myerson, "Optimal Auction Design," Math Oper Res, doi: 10.1287/moor.6.1.58.
[2]C. Guo, Z. Huang, and X. Zhang, "Settling the Sample Complexity of Single-Parameter Revenue Maximization," in Proceedings of the 51st Annual ACM SIGACT Symposium on Theory of Computing, doi: 10.1145/3313276.3316325.
[3]P. Tang and Y. Zeng, "The Price of Prior Dependence in Auctions," in Proceedings of the 2018 ACM Conference on Economics and Computation, doi: 10.1145/3219166.3219183.?
總結
以上是生活随笔為你收集整理的Private Data Manipulation in Optimal Sponsored Search Auction的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 装一颗种植牙要多少钱
- 下一篇: Apache Doris : 一个开源