RecSys 2017总结
生活随笔
收集整理的這篇文章主要介紹了
RecSys 2017总结
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
版權歸作者所有,任何形式轉載請聯系作者。
作者:咚咚咚diduan(來自豆瓣)
來源:https://www.douban.com/note/662840537/
今年的ACM RecSys在美麗的科莫湖畔舉辦,本文將從會議總覽,推薦系統技術與發展趨勢,個人觀感三個方面介紹本次大會。
會議總覽
今年的RecSys接收26篇long paper(接收率:20.8%),20篇short paper(接收率:16.4%),研究內容覆蓋human factor, algorithms, ranking, diversity, privacy等主題。由于沒有像去年舉辦的RecSys那樣限制參會人數,本次會議的與會者歷史性地超過了600人,來自歐洲、中東和非洲等地區的參會人數明顯增加。RecSys得到了工業界一如既往地重視,Google,Facebook,Microsoft,Criteo,Spotify,Apple,Amazon,Hulu以及阿里、百度、華為都派出了為數不少的推薦團隊參會,其中,華為也是本次RecSys的鉑金贊助商。在industry track中,工業界貢獻了3個session,12個talk,演講者來自微軟,Netflix,LinkedIn,EA,AirBnB,以及一些Startup公司。
趨勢與技術
1. 對話式推薦
本次RecSys讓我愈加相信:通過對話的方式(語音或文本輸入)為用戶提供內容的搜索、推薦和發現服務,將會成為推薦的主流形式。目前,業界已經有較為成型的產品,如Echo,Apple Siri,京東小咚等。本次會議相關研究包括2篇研究論文和1個keynote,下面分別對其進行解讀:
Short paper:“Defining and supporting narrative-driven recommendation”是來自心理學家的研究,給出了敘述式推薦請求的定義,分析該類型推薦的組成成分,并對用戶的敘述式需求進行了分類,最后通過對讀書論壇帖子數據的量化分析,計算敘述式推薦請求的普遍程度,以及各種需求類型的占比。
Long paper:“Understanding how people use natural language to ask for recommendations”,這是一項典型的GroupLens style研究工作,作者通過user study實驗收集用戶陳述電影推薦需求的文本數據,進而分析用戶的一次請求和二次請求的類別,比較文本輸入和語音輸入的差異,最后針對對話式推薦的系統設計給出如下建議:
(1)在實施推薦前,對用戶陳述的需求意圖進行分類,大致可以分為客觀、主觀、導航三類;分情況給予推薦服務,如客觀意圖(如用戶敘述為“關于二戰的電影”,二戰電影為客觀詞匯):根據陳述中的客觀詞匯過濾推薦結果;如主觀意圖(如用戶敘述為“關于二戰的電影,但不要過于血腥”,不要過于血腥味主觀詞匯):根據主觀詞匯進行排序;如導航(“如用戶敘述為我想看兵臨城下”,兵臨城下為用戶直接想要的結果):像搜索一樣直接返回搜索詞的相關列表。
(2)對用戶二次陳述的推薦意圖分類,大致分為兩類refine和start over,分情況給予推薦服務,如refine:在第一輪推薦結果的基礎上根據二次陳述中的限定條件予以過濾,或給予用戶更多查詢選型(suggested tags);start over:當二次陳述與一次陳述無關式進行重新查詢。
(3)鑒于本研究發現的用戶使用語音輸入與文本輸入的不同之處,系統設計者需要考慮這個問題:使用文本輸入的數據集作為熱啟動數據,構建面向語音輸入形態的對話推薦是否合理??
這篇文章是human factor領域的典范研究,更多地從人的角度研究推薦,值得我們學習。
Keynote:Memory networks for Recommendation,來自于Facebook AI research的科學家Jason Weston,他的合適觀點是推薦即對話,而Machine learning end-to-end system是終極解決方案,其中memory network是其中最為關鍵的技術。Jason介紹Facebook AI團隊近年來在智能對話方面的的研究成果,最后著重介紹了Fackbook開源的對話研究平臺:ParlAI,提供了對話研究和實現的框架,可以訓練和評估dialog agent,開源了對話相關的數據集和算法,還能與Amazon Mechanical Turk無縫對接。相信ParlAI可以大力推動智能對話和對話式推薦研究的進展,此處要給Facebook掌聲。
2. 深度學習
如果說深度學習的研究在去年的RecSys會議只是牛刀小試(請參考我的另一篇文章2016 RecSys參會總結:www.douban.com/note/583716751),那么深度學習已經成為了今年RecSys最受關注、論文收錄最多的研究主題,會議包含了關于深度學習的1個tutorial,1個workshop,1個keynote,收入近20篇深度學習相關論文。研究方向主要包括:item embedding,deep collaborative filtering, feature extraction,session-based recommendation等。
Telefonical research 的主任研究員Alexandros帶來了主題為deep learning for Recommendation systems的tutorial, 說明了深度學習在推薦系統應用的優勢,主要包括自動抽取復雜域的特征,如圖像、聲音、文本等;善于處理異質數據;RNN能夠較好地對動態或序列行為建模;可以用于用戶和商品的新型表達學習方式。這個Tutorial也是目前我見過的最全面的面向推薦系統的深度學習技術的總結,這是該tutorial slides的下載鏈接:
https://www.slideshare.net/kerveros99/deep-learning-for-recommender-systems-recsys2017-tutorial。
本屆RecSys值得關注的深度學習論文還包括:
Getting Deep Recommenders Fit: Bloom Embeddings for Sparse Binary Input/Output Networks?
Interpretable Convolutional Neural Networks with Dual Local and Global Attention for Review Rating Prediction
When Recurrent Neural Networks meet the Neighborhood for Session-Based Recommendation?
Recommendation of High Quality Representative Reviews in e-commerce
Personalizing Session-based Recommendations with Hierarchical Recurrent Neural Networks?
Sequential User-based Recurrent Neural Network Recommendations
Deep Cross-Domain Fashion Recommendation
Boosting Recommender Systems with Deep Learning
3. 隱私
隱私保護是所有大數據應用都要面對的問題,推薦系統作為大數據應用中最重要的方向之一,亟需解決如何在保護用戶隱私的前提下,為用戶提供精準推薦?另一個重要背景是歐盟通過了General Data Protection Regulation(GDPR)法案,將于18年5月25日正式實施,該法案旨在保護歐盟公民的數據隱私,規范組織使用用戶數據的方式、方法。這一法案需要引起志在出海的中國科技巨頭們的關注。今年的RecSys涉及隱私相關研究的內容包括1個keynote,1個tutorial,以及一篇long paper:secure multi-party protocols for item-based collaborative filtering。
一些經典的模型和方法得到了更加深入的研究,在FM:an elementary view on factorization machine一文中,作者指出了經典FM優化的一些問題和bad case,并嘗試用非對稱優化的方法解決。在learning to rank相關應用中,RankSVM和LambdaMART模型已經成為了標準的基線方法。一些研究聚焦于推薦系統在特定domain下應用,如時尚產品推薦,游戲推薦,健康建議推薦等。
4. 來自資深專家的聲音
在plenary panel discussion環節,會議邀請了RecSys領域最資深的4位專家討論推薦系統的現狀和未來,他們分別是:
明尼蘇達大學GroupLens實驗室等Joe Konstan教授(ACM RecSys締造者之一,也是第一屆RecSys的主席)
Xavier Amatriain(Netflix的推薦系統的前任負責人,Quora的前任技術VP)
匹茲堡大學的Peter Brusilovsky教授(用戶建模,交互式推薦的資深專家)
明尼蘇達大學等George Karypis教授(數據挖掘,推薦系統模型,高性能計算等領域頂尖的研究者,也是WWW會議歷史引用數第二高論文item-based CF recommendation algorithms的作者之一)。
下面簡述幾位專家對RecSys 會議的期望:系統設計者需要考慮。
Xavier:我們應該更多地鼓勵公開數據集;我們需要更多地支持開源初始化的工作;增加工業界在RecSys會議和community的影響力;RecSys是否應該從ACM/SIGCHI獨立出來,形成自己獨立的社區?
George:不希望ACM RecSys成為另一個KDD,ICML或者BigData會議,研究要有推薦系統關聯的insight。希望RecSys能過一如既往地強調用戶建模和領域建模;希望推薦系統研究能夠整合來在心理學,經濟學,教育和市場營銷方面的理論研究;聚焦解決那些難的問題,如評價,公平等;工業界積極地參與,以及創新的應用領域。
Joe提出一個有趣的建議,他希望RecSys會議未來的審稿過程可以這樣:投稿人在做研究前,先將研究計劃書提交給評委,由評委決策該研究是否適合RecSys會議,并給予指導意見,投稿人再根據意見重新設計研究主題,制定計劃,進行研究。這樣可以讓投稿的論文與RecSys的主題更加契合,也可以節省審稿者和投稿人的時間。
個人觀感
不知不覺,ACM RecSys已經舉辦了11屆,聽Joe Konstan教授講起,首屆RecSys 2007還是在密西西比河右岸明尼蘇達大學的圖書館舉辦,Joe是那屆會議的主席,John Riedl教授是程序委員會主席,那時參會的人數很少,贊助商也只有4家。十年之間,隨著互聯網、電子商務技術的蓬勃發展,個性化技術越來越普及,推薦系統成為了科技公司的核心競爭力,而如今的ACM RecSys已經成為了最受歡迎的學術會議之一,而推薦系統研究的先驅,GroupLens實驗室的創始人John Riedl教授也離開了我們……
回想自己在2007年讀研一時,通過電子報紙項目認識到個性化推薦的重要作用,通過閱讀了相關論文和谷哥的博客Beyond Search,了解推薦系統的研究進展和工業界應用現狀;用MovieLens數據集做最經典的user based KNN實驗室;從豆瓣上爬取電影、圖書、唱片的元數據以及用戶對它們的評分數據,實現各種經典的推薦算法,并用在跨域推薦領域;因為醉心于推薦系統,所以我會從天津到北京,參加RecSys China組織的線下活動,第一次是在奇遇咖啡館,項亮介紹Netflix prize百萬美元競賽使用的預測技術,第二次是在豆瓣總部,聽王守崑介紹豆瓣的推薦系統;后來有機會去GroupLens實驗室交流學習,在Riedl,Loren,Shilad教授的指導下從事human factor方面的研究,并用第一手的MovieLens和Wikipedia數據集做實驗,提煉有趣研究問題,撰寫有影響力的論文。
在GroupLens的經歷,教會了我很多:什么才是有價值的研究?做什么樣的研究?如何做研究?如何與別人合作共贏?那也是我最快樂的一段時光,因為我與最優秀的人一起共事,堅信自己做著改變世界的事情。回國完成博士學業后,加入華為諾亞方舟實驗室,做面向工業界的推薦系統,直接為用戶提供個性化推薦服務,很幸運,工作期間先后得到了楊強老師,戴文淵,李航老師,林智仁老師,何秀強的幫助和指導,并將我們構建的推薦系統在華為最主要的產品線上應用落地,并在實際產品中不斷實踐新的模型算法、系統平臺和推薦策略,在為公司創造價值的同時用活的數據和真實推薦場景驗證新的技術,讓預研與應用形成良性互補。
想來自己作為研究者,是幸運的,可以在一個領域專研十年,有幸能與這個領域最優秀的專家、學者共事,在學術方面,做有趣的、前瞻性的研究,在工業界,使用推薦系統技術實現了大數據價值的變現,在提升用戶體驗的同時,為公司賺取真金白銀。
因為推薦系統,讓我有機會結識了很多志同道合的師長、朋友,今年的ACM RecSys,很高興見到了很多故人、舊友,同時也結交了不少新的朋友,收獲了很多新的想法和深刻的見解,感覺人生又完滿了些。最后,祝福RecSys越辦越好,我也會為RecSys的發展多做貢獻,RecSys 2018,溫哥華見!
作者:咚咚咚diduan(來自豆瓣)
來源:https://www.douban.com/note/662840537/
今年的ACM RecSys在美麗的科莫湖畔舉辦,本文將從會議總覽,推薦系統技術與發展趨勢,個人觀感三個方面介紹本次大會。
會議總覽
今年的RecSys接收26篇long paper(接收率:20.8%),20篇short paper(接收率:16.4%),研究內容覆蓋human factor, algorithms, ranking, diversity, privacy等主題。由于沒有像去年舉辦的RecSys那樣限制參會人數,本次會議的與會者歷史性地超過了600人,來自歐洲、中東和非洲等地區的參會人數明顯增加。RecSys得到了工業界一如既往地重視,Google,Facebook,Microsoft,Criteo,Spotify,Apple,Amazon,Hulu以及阿里、百度、華為都派出了為數不少的推薦團隊參會,其中,華為也是本次RecSys的鉑金贊助商。在industry track中,工業界貢獻了3個session,12個talk,演講者來自微軟,Netflix,LinkedIn,EA,AirBnB,以及一些Startup公司。
趨勢與技術
1. 對話式推薦
本次RecSys讓我愈加相信:通過對話的方式(語音或文本輸入)為用戶提供內容的搜索、推薦和發現服務,將會成為推薦的主流形式。目前,業界已經有較為成型的產品,如Echo,Apple Siri,京東小咚等。本次會議相關研究包括2篇研究論文和1個keynote,下面分別對其進行解讀:
Short paper:“Defining and supporting narrative-driven recommendation”是來自心理學家的研究,給出了敘述式推薦請求的定義,分析該類型推薦的組成成分,并對用戶的敘述式需求進行了分類,最后通過對讀書論壇帖子數據的量化分析,計算敘述式推薦請求的普遍程度,以及各種需求類型的占比。
Long paper:“Understanding how people use natural language to ask for recommendations”,這是一項典型的GroupLens style研究工作,作者通過user study實驗收集用戶陳述電影推薦需求的文本數據,進而分析用戶的一次請求和二次請求的類別,比較文本輸入和語音輸入的差異,最后針對對話式推薦的系統設計給出如下建議:
(1)在實施推薦前,對用戶陳述的需求意圖進行分類,大致可以分為客觀、主觀、導航三類;分情況給予推薦服務,如客觀意圖(如用戶敘述為“關于二戰的電影”,二戰電影為客觀詞匯):根據陳述中的客觀詞匯過濾推薦結果;如主觀意圖(如用戶敘述為“關于二戰的電影,但不要過于血腥”,不要過于血腥味主觀詞匯):根據主觀詞匯進行排序;如導航(“如用戶敘述為我想看兵臨城下”,兵臨城下為用戶直接想要的結果):像搜索一樣直接返回搜索詞的相關列表。
(2)對用戶二次陳述的推薦意圖分類,大致分為兩類refine和start over,分情況給予推薦服務,如refine:在第一輪推薦結果的基礎上根據二次陳述中的限定條件予以過濾,或給予用戶更多查詢選型(suggested tags);start over:當二次陳述與一次陳述無關式進行重新查詢。
(3)鑒于本研究發現的用戶使用語音輸入與文本輸入的不同之處,系統設計者需要考慮這個問題:使用文本輸入的數據集作為熱啟動數據,構建面向語音輸入形態的對話推薦是否合理??
這篇文章是human factor領域的典范研究,更多地從人的角度研究推薦,值得我們學習。
Keynote:Memory networks for Recommendation,來自于Facebook AI research的科學家Jason Weston,他的合適觀點是推薦即對話,而Machine learning end-to-end system是終極解決方案,其中memory network是其中最為關鍵的技術。Jason介紹Facebook AI團隊近年來在智能對話方面的的研究成果,最后著重介紹了Fackbook開源的對話研究平臺:ParlAI,提供了對話研究和實現的框架,可以訓練和評估dialog agent,開源了對話相關的數據集和算法,還能與Amazon Mechanical Turk無縫對接。相信ParlAI可以大力推動智能對話和對話式推薦研究的進展,此處要給Facebook掌聲。
2. 深度學習
如果說深度學習的研究在去年的RecSys會議只是牛刀小試(請參考我的另一篇文章2016 RecSys參會總結:www.douban.com/note/583716751),那么深度學習已經成為了今年RecSys最受關注、論文收錄最多的研究主題,會議包含了關于深度學習的1個tutorial,1個workshop,1個keynote,收入近20篇深度學習相關論文。研究方向主要包括:item embedding,deep collaborative filtering, feature extraction,session-based recommendation等。
Telefonical research 的主任研究員Alexandros帶來了主題為deep learning for Recommendation systems的tutorial, 說明了深度學習在推薦系統應用的優勢,主要包括自動抽取復雜域的特征,如圖像、聲音、文本等;善于處理異質數據;RNN能夠較好地對動態或序列行為建模;可以用于用戶和商品的新型表達學習方式。這個Tutorial也是目前我見過的最全面的面向推薦系統的深度學習技術的總結,這是該tutorial slides的下載鏈接:
https://www.slideshare.net/kerveros99/deep-learning-for-recommender-systems-recsys2017-tutorial。
本屆RecSys值得關注的深度學習論文還包括:
Getting Deep Recommenders Fit: Bloom Embeddings for Sparse Binary Input/Output Networks?
Interpretable Convolutional Neural Networks with Dual Local and Global Attention for Review Rating Prediction
When Recurrent Neural Networks meet the Neighborhood for Session-Based Recommendation?
Recommendation of High Quality Representative Reviews in e-commerce
Personalizing Session-based Recommendations with Hierarchical Recurrent Neural Networks?
Sequential User-based Recurrent Neural Network Recommendations
Deep Cross-Domain Fashion Recommendation
Boosting Recommender Systems with Deep Learning
3. 隱私
隱私保護是所有大數據應用都要面對的問題,推薦系統作為大數據應用中最重要的方向之一,亟需解決如何在保護用戶隱私的前提下,為用戶提供精準推薦?另一個重要背景是歐盟通過了General Data Protection Regulation(GDPR)法案,將于18年5月25日正式實施,該法案旨在保護歐盟公民的數據隱私,規范組織使用用戶數據的方式、方法。這一法案需要引起志在出海的中國科技巨頭們的關注。今年的RecSys涉及隱私相關研究的內容包括1個keynote,1個tutorial,以及一篇long paper:secure multi-party protocols for item-based collaborative filtering。
一些經典的模型和方法得到了更加深入的研究,在FM:an elementary view on factorization machine一文中,作者指出了經典FM優化的一些問題和bad case,并嘗試用非對稱優化的方法解決。在learning to rank相關應用中,RankSVM和LambdaMART模型已經成為了標準的基線方法。一些研究聚焦于推薦系統在特定domain下應用,如時尚產品推薦,游戲推薦,健康建議推薦等。
4. 來自資深專家的聲音
在plenary panel discussion環節,會議邀請了RecSys領域最資深的4位專家討論推薦系統的現狀和未來,他們分別是:
明尼蘇達大學GroupLens實驗室等Joe Konstan教授(ACM RecSys締造者之一,也是第一屆RecSys的主席)
Xavier Amatriain(Netflix的推薦系統的前任負責人,Quora的前任技術VP)
匹茲堡大學的Peter Brusilovsky教授(用戶建模,交互式推薦的資深專家)
明尼蘇達大學等George Karypis教授(數據挖掘,推薦系統模型,高性能計算等領域頂尖的研究者,也是WWW會議歷史引用數第二高論文item-based CF recommendation algorithms的作者之一)。
下面簡述幾位專家對RecSys 會議的期望:系統設計者需要考慮。
Xavier:我們應該更多地鼓勵公開數據集;我們需要更多地支持開源初始化的工作;增加工業界在RecSys會議和community的影響力;RecSys是否應該從ACM/SIGCHI獨立出來,形成自己獨立的社區?
George:不希望ACM RecSys成為另一個KDD,ICML或者BigData會議,研究要有推薦系統關聯的insight。希望RecSys能過一如既往地強調用戶建模和領域建模;希望推薦系統研究能夠整合來在心理學,經濟學,教育和市場營銷方面的理論研究;聚焦解決那些難的問題,如評價,公平等;工業界積極地參與,以及創新的應用領域。
Joe提出一個有趣的建議,他希望RecSys會議未來的審稿過程可以這樣:投稿人在做研究前,先將研究計劃書提交給評委,由評委決策該研究是否適合RecSys會議,并給予指導意見,投稿人再根據意見重新設計研究主題,制定計劃,進行研究。這樣可以讓投稿的論文與RecSys的主題更加契合,也可以節省審稿者和投稿人的時間。
個人觀感
不知不覺,ACM RecSys已經舉辦了11屆,聽Joe Konstan教授講起,首屆RecSys 2007還是在密西西比河右岸明尼蘇達大學的圖書館舉辦,Joe是那屆會議的主席,John Riedl教授是程序委員會主席,那時參會的人數很少,贊助商也只有4家。十年之間,隨著互聯網、電子商務技術的蓬勃發展,個性化技術越來越普及,推薦系統成為了科技公司的核心競爭力,而如今的ACM RecSys已經成為了最受歡迎的學術會議之一,而推薦系統研究的先驅,GroupLens實驗室的創始人John Riedl教授也離開了我們……
回想自己在2007年讀研一時,通過電子報紙項目認識到個性化推薦的重要作用,通過閱讀了相關論文和谷哥的博客Beyond Search,了解推薦系統的研究進展和工業界應用現狀;用MovieLens數據集做最經典的user based KNN實驗室;從豆瓣上爬取電影、圖書、唱片的元數據以及用戶對它們的評分數據,實現各種經典的推薦算法,并用在跨域推薦領域;因為醉心于推薦系統,所以我會從天津到北京,參加RecSys China組織的線下活動,第一次是在奇遇咖啡館,項亮介紹Netflix prize百萬美元競賽使用的預測技術,第二次是在豆瓣總部,聽王守崑介紹豆瓣的推薦系統;后來有機會去GroupLens實驗室交流學習,在Riedl,Loren,Shilad教授的指導下從事human factor方面的研究,并用第一手的MovieLens和Wikipedia數據集做實驗,提煉有趣研究問題,撰寫有影響力的論文。
在GroupLens的經歷,教會了我很多:什么才是有價值的研究?做什么樣的研究?如何做研究?如何與別人合作共贏?那也是我最快樂的一段時光,因為我與最優秀的人一起共事,堅信自己做著改變世界的事情。回國完成博士學業后,加入華為諾亞方舟實驗室,做面向工業界的推薦系統,直接為用戶提供個性化推薦服務,很幸運,工作期間先后得到了楊強老師,戴文淵,李航老師,林智仁老師,何秀強的幫助和指導,并將我們構建的推薦系統在華為最主要的產品線上應用落地,并在實際產品中不斷實踐新的模型算法、系統平臺和推薦策略,在為公司創造價值的同時用活的數據和真實推薦場景驗證新的技術,讓預研與應用形成良性互補。
想來自己作為研究者,是幸運的,可以在一個領域專研十年,有幸能與這個領域最優秀的專家、學者共事,在學術方面,做有趣的、前瞻性的研究,在工業界,使用推薦系統技術實現了大數據價值的變現,在提升用戶體驗的同時,為公司賺取真金白銀。
因為推薦系統,讓我有機會結識了很多志同道合的師長、朋友,今年的ACM RecSys,很高興見到了很多故人、舊友,同時也結交了不少新的朋友,收獲了很多新的想法和深刻的見解,感覺人生又完滿了些。最后,祝福RecSys越辦越好,我也會為RecSys的發展多做貢獻,RecSys 2018,溫哥華見!
總結
以上是生活随笔為你收集整理的RecSys 2017总结的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 原创 | 灵魂拷问:Java对象的内存分
- 下一篇: RecSys 2016总结