【推荐系统】基于图嵌入技术的推荐系统长文综述
|作者:鄧月
|?單位:電子科技大學
|?研究方向:圖嵌入技術、推薦系統
近幾年,基于圖嵌入技術的推薦系統已成為一個熱門的研究焦點,并將隨著圖嵌入技術的不斷發展而持續。近日發布的《基于圖嵌入技術的推薦系統》長文綜述,系統地闡述了二部圖、廣義圖和知識圖譜上的圖嵌入技術,以及將它們應用到對應推薦場景中的推薦模型。同時還在傳統推薦(例如UBCF、IBCF這類直接作用在網絡拓撲結構上進行分析的、非機器學習的推薦模型)和基于圖嵌入的推薦之間通過實驗進行了比較,提出了在兩者間進行權衡的策略和在兩者間進行融合的新觀點。
論文地址:https://arxiv.org/pdf/2109.09587
大數據對用戶的生活有益嗎?大多數人或許會異口同聲道:always! 確實,從這次疫情期間的國家防控工作中就能切身感受到,交通大數據能夠極大地幫助我們挖掘出可能存在的潛在感染者。對于科研工作,學術大數據也能促進研究人員之間的合作。此外,在日常生活中,平時為我們帶來娛樂和便利的百度和淘寶等等,無一不是背后的多媒體大數據在支撐其高效的運作。然而,讓我們更加辯證地來看待這個問題:大數據難道就不會對用戶的生活帶來不利影響嗎?回想一下,我們沒有過在百度視頻上半天也刷不到自己感興趣的短視頻而消耗無效時間的捉急嗎?我們沒有過在淘寶上半天也找不到自己喜歡的商品而不得不翻來翻去的不甘嗎?大數據在數量上的大規模、種類上的多樣化以及質量上的層次不齊也會降低用戶對有效信息的檢索效率,增加用戶的時間開銷。這就是大數據時代背景下的“信息過載”難題。
為了解決這一難題,推薦系統是一個有力的工具。它的目標是為用戶從大數據中自動篩選出感興趣的內容。說到這里,我們或許能夠突然意識到:推薦系統早已融入了我們的生活中,比如能夠為我們自動推薦感興趣的短視頻的抖音,或者是出現在淘寶首頁的“您可能感興趣的物品”等。更進一步地,推薦系統的原理就是通過分析用戶和物品(比如短視頻、商品等)已有的交互記錄(如:點擊、觀看和評分等),推斷出用戶對物品的偏好,從而利用用戶偏好來匹配到用戶感興趣的物品,最終實現推薦。
然而,僅利用用戶和物品已有的交互記錄來進行推薦有兩個顯而易見的弊端:
(1)用戶不可能與上億級的每個物品都發生過交互,現實是用戶和物品間的交互數往往會特別稀疏,導致推薦系統在基于不充足的用戶-物品交互記錄進行分析而推斷出的用戶偏好沒那么準確。這就是推薦系統面臨的第一個典型的難題——“稀疏性”難題。
(2)更壞的情況是,對于剛進入到推薦系統中的新用戶或新物品,它們還沒來得及與其他任何的物品或用戶有過交互,使得連最基本的用于推薦系統分析的原料都缺失了。這就是推薦系統面臨的第二個典型的難題——“冷啟動”難題。
為了解決上述兩類難題,利用邊信息和知識作為用戶-物品交互記錄的補充,來挖掘出更多的潛在的用戶-物品關聯,從而豐富用于推薦系統分析的原料,已成為近年來的一個趨勢,并被證明是有效的。邊信息和知識往往具有超大的數據規模和超高的語義復雜度,因此對推薦模型的可擴展性,即在大規模高復雜度數據上運行的效率和表現效果,有著極高的要求。
縱觀推薦系統這十幾年的發展,可謂是“從網絡拓撲結構分析到機器學習、從傳統推薦到基于圖嵌入的推薦、從僅利用用戶-物品交互記錄到融入邊信息和知識、從模型準確性延伸出對模型可擴展性等的要求”。在此趨勢下,基于圖嵌入的推薦系統是否就可以取代傳統推薦呢?本文從理論上比較了這兩者間的優劣勢,總結為如下圖所示。
此外,本文還在這兩類推薦中挑選出最具代表性的推薦模型用于仿真對照實驗,得出它們在6個不同任務下(由3組數據分別導出的顯示/隱式用戶-物品交互預測任務)的推薦準確性表現。實驗得出的結論是:在隱式用戶-物品交互預測任務中,傳統推薦整體上仍優于圖嵌入的推薦。
綜上,本文得出的結論為:傳統推薦側重于直接分析圖拓撲結構,而基于圖嵌入技術的推薦則更側重于復用學習到的表示向量。相比于僅關注其一,將二者的思想進行結合,或將更能夠促進推薦系統的發展。 幾年來,也有不少研究將網絡拓撲結構中的模體、社團等子圖用于指導基于圖嵌入技術的推薦,如隨機游走和圖神經網絡的信息傳遞規則等。
為了推動這一趨勢,本文號召來自不同學科領域的研究人員開展交叉研究合作。對此,關于傳統推薦和基于圖嵌入技術的推薦的詳盡的綜述是實現如此溝通的橋梁。雖然前者已具備,但縱觀近幾年發表的綜述后,發現后者仍缺失。本文旨在對其進行彌補,分別從二部圖、廣義圖和知識圖譜的視角系統地綜述了圖嵌入技術及相應的推薦模型,總結為下面三張圖所示。
基于二部圖嵌入推薦系統發展歷程基于常規圖嵌入推薦系統發展歷程
基于知識圖嵌入推薦系統發展歷程以及對它們各自的優勢和劣勢進行了總結比較,如下圖所示:
同時,為了更有效地對這些框架下的推薦模型進行全新的建模,推動領域的發展,本文還提出了一個用于基于圖嵌入技術的推薦系統的建模方案。其結合了計算機科學家偏向的“從數據(任務)出發”的角度和物理學家偏向的“從通用性出發”的角度,如下圖所示。該建模方案中也涵蓋了推薦系統,包括傳統推薦和基于圖嵌入技術的推薦,的連貫運行流程:輸入信息、構造圖表示、設置相似性度量、選定推薦方法和構造推薦模型。本文認為,推薦模型的建模過程應是上述整套流程的體現。
本文系統性的分析與總結了基于圖嵌入技術的推薦系統相關文獻,并基于既有實驗提出了自己的結論與觀點。文中若有不妥之處以及需要改進的地方,歡迎同行提出寶貴意見與建議。
郵箱:201921210214@std.uestc.edu.cn
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統計學習方法》的代碼復現專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件本站qq群851320808,加入微信群請掃碼:
總結
以上是生活随笔為你收集整理的【推荐系统】基于图嵌入技术的推荐系统长文综述的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【Python】Python中的for循
- 下一篇: 【CV】基于阈值处理的图像分割算法!