Youtube深度学习推荐系统
這里是王喆的機器學習筆記,每隔一到兩周我會站在算法工程師的角度講解一些計算廣告、推薦系統相關的文章。選擇文章必須滿足一下三個條件:
- 一是工程導向的;
- 二是阿里、facebook、google等一線互聯網公司出品的;
- 三是前沿或者經典的。
這周我們一起討論一下Youtube的深度推薦系統論文《Deep Neural Networks for YouTube Recommendations》,這是2016年的論文,按照今天的標準來看,已經沒有什么新穎的地方,我也是兩年前讀過這篇文章之后就放下了,但前幾天重讀這篇文章,竟讓發現了諸多亮點,幾乎處處是套路,處處是經驗,不由驚為神文。這篇神文給我留下的深刻印象有兩點:
?
廢話不多說,下面就跟大家分享一下兩次拜讀這篇論文的不同體驗和收獲。
第一遍讀這篇論文的時候,我想所有人都是沖著算法的架構去的,在深度學習推薦系統已經成為各大公司“基本操作”的今天,Youtube在算法架構上并無驚奇之處,我們來快速介紹一下文章中的深度學習推薦系統的算法架構。
?
Youtube的用戶推薦場景自不必多說,作為全球最大的UGC的視頻網站,需要在百萬量級的視頻規模下進行個性化推薦。由于候選視頻集合過大,考慮online系統延遲問題,不宜用復雜網絡直接進行推薦,所以Youtube采取了兩層深度網絡完成整個推薦過程:
首先介紹candidate generation模型的架構
Youtube Candidate Generation Model
?
我們自底而上看這個網絡,最底層的輸入是用戶觀看過的video的embedding向量,以及搜索詞的embedding向量。至于這個embedding向量是怎么生成的,作者的原話是這樣的
Inspired by continuous bag of words language models, we learn high dimensional embeddings for each video in a xed vocabulary and feed these embeddings into a feedforward neural network所以作者是先用word2vec方法對video和search token做了embedding之后再作為輸入的,這也是做embedding的“基本操作”,不用過多介紹;當然,除此之外另一種大家應該也比較熟悉,就是通過加一個embedding層跟上面的DNN一起訓練,兩種方法孰優孰劣,有什么適用場合,大家可以討論一下。
?
特征向量里面還包括了用戶的地理位置的embedding,年齡,性別等。然后把所有這些特征concatenate起來,喂給上層的ReLU神經網絡。
三層神經網絡過后,我們看到了softmax函數。這里Youtube的同學們把這個問題看作為用戶推薦next watch的問題,所以輸出應該是一個在所有candidate video上的概率分布,自然是一個多分類問題。
好了,這一套深度學習的“基本操作”下來,就構成了Youtube的candidate generation網絡,看似平淡無奇,其實還是隱藏著一些問題的,比如
這些問題在讀第一遍的時候我也沒有深想深看,但卻是工程實現中必然會遇到的問題,我們隨后再深入介紹論文中的解決方法。
既然得到了幾百個候選集合,下一步就是利用ranking模型進行精排序,下面是ranking深度學習網絡的架構圖。
Youtube Ranking Model
?
乍一看上面的ranking model似乎與candidate generation模型沒有什么區別,模型架構還是深度學習的“基本操作”,唯一的區別就是特征工程,那么我們就講講特征工程。
事實上原文也明確說明了,引入另一套DNN作為ranking model的目的就是引入更多描述視頻、用戶以及二者之間關系的特征,達到對候選視頻集合準確排序的目的。
During ranking, we have access to many more features describing the video and the user's relationship to the video because only a few hundred videos are being scored rather than the millions scored in candidate generation.具體一點,從左至右的特征依次是
上面五個特征中,我想重點談談第4個和第5個。因為這兩個很好的引入了對用戶行為的觀察。
第4個特征背后的思想是
We observe that the most important signals are those that describe a user's previous interaction with the item itself and other similar items.有一些引入attention的意思,這里是用了time since last watch這個特征來反應用戶看同類視頻的間隔時間。從用戶的角度想一想,假如我們剛看過“DOTA經典回顧”這個channel的視頻,我們很大概率是會繼續看這個channel的視頻的,那么該特征就很好的捕捉到了這一用戶行為。
第5個特征#previous impressions則一定程度上引入了exploration的思想,避免同一個視頻持續對同一用戶進行無效曝光。盡量增加用戶沒看過的新視頻的曝光可能性。
?
至此,我的第一遍論文閱讀就結束了,對Youtube的算法框架有了概念,但總覺得不過如此,沒什么太多新穎的地方。。
但如果真這么想,還是太naive了,與上一篇阿里的深度興趣網絡DIN不同的是,你讀懂了DIN的attention機制,你就抓住了其論文70%的價值,但這篇文章,如果你只讀懂了Youtube的推薦系統架構,你只抓住了30%的價值。那么剩下的70%的價值在哪里呢?
在重讀這篇文章的時候,我從一個工程師的角度,始終繃著“如何實現”這根弦,發現這篇論文的工程價值之前被我大大忽略了。下面我列出十個文中解決的非常有價值的問題:
?
因為我也是在視頻推薦領域工作,所以可以很負責任的說以上的十個問題都是非常有價值的。但今天一口氣寫到這里,感覺有點氣力不足了。。大家如果感興趣的話可以點個贊,我明天再詳細分析一下以上十大問題的答案。
上面問題的解答已經完成啦,大家請參考我的下一篇文章——
王喆:YouTube深度學習推薦系統的十大工程問題?zhuanlan.zhihu.com
好了,這里是王喆的機器學習筆記的第二篇文章,水平有限,歡迎大家吐槽,批評,糾錯。
也歡迎大家關注我的同名微信公眾號 王喆的機器學習筆記(wangzhenotes),或者通過公眾號加我的個人微信進行進一步交流討論,謝謝。
?
參考資料:
總結
以上是生活随笔為你收集整理的Youtube深度学习推荐系统的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 胆囊炎能不能吃麦片
- 下一篇: spring-statemachine有