推荐策略产品经理:剖析协同过滤(千人千面推荐的核心 )
本文為PMCAFF專(zhuān)欄作者鳳城狂客出品
前文:剖析千人千面的大腦——推薦引擎部分,其中這篇是定位:對(duì)推薦引擎中的核心算法:協(xié)同過(guò)濾進(jìn)行深挖。
首先,千人千面融合各種場(chǎng)景,如搜索,如feed流,如廣告,如風(fēng)控,如策略增長(zhǎng),如購(gòu)物全流程等等;其次千人千面的大腦肯定是內(nèi)部的推薦引擎,這里有諸多規(guī)則和算法在實(shí)現(xiàn)對(duì)上述各個(gè)場(chǎng)景進(jìn)行“細(xì)分推薦排序”;最后是推薦引擎的算法又以“協(xié)同過(guò)濾”為最核心、最主流熱門(mén),也是當(dāng)下眾多內(nèi)容型、電商型、社交工具、分發(fā)型的基礎(chǔ)。
面試關(guān)鍵詞:覆蓋廣、適用性強(qiáng)、推薦引擎的算法核心,也是最有價(jià)值的算法之一。
所以,這篇是深挖:協(xié)同過(guò)濾的算法。
由于協(xié)同過(guò)濾的算法介紹,網(wǎng)上也蠻多但片段化。要么側(cè)重講“原理流程”,這個(gè)占了4成;要么講算法公式,這個(gè)占5成;還有1成是偏向業(yè)務(wù)的理解,但這個(gè)籠統(tǒng)很難參考。
因此,這篇是屬于推薦引擎-理論搭建體系-之二,PM可以側(cè)重關(guān)注:
(1)了解協(xié)同過(guò)濾之前,先知道什么是:集體智慧。(沒(méi)有對(duì)比就沒(méi)有“感知”,這個(gè)集體智慧是更好幫助了解、對(duì)比協(xié)同過(guò)濾。因?yàn)榫W(wǎng)上很多片段化的文章,沒(méi)有對(duì)比出來(lái),不利于PM去聯(lián)想和學(xué)習(xí)的)
(2)了解什么是協(xié)同過(guò)濾(這點(diǎn)偏向理論,網(wǎng)上的很多也如此。但我挑選了精簡(jiǎn)部分,就只要2點(diǎn)關(guān)鍵:1知道它有什么作用,2為什么需要是它)
(3)學(xué)習(xí)協(xié)同過(guò)濾的核心。要實(shí)現(xiàn)包括三大重要部分:干貨,核心
收集用戶偏好(知道為什么要收、收哪些哪樣的、如何收集、收集過(guò)程有什么原則?);
找到相似的用戶或者物品(這里的核心有2大方面:1是怎樣定義算“相似”,屬于相似度問(wèn)題,用什么公式去計(jì)算、有什么特點(diǎn);2是相似鄰居問(wèn)題,可用什么公式計(jì)算兩個(gè)相似鄰居);
計(jì)算推薦(這里核心是基于物品的方式是如何計(jì)算推薦、基于用戶又是如何、兩者PK又有什么差異點(diǎn),如在場(chǎng)景,多樣性)每個(gè)部分再挖出各個(gè)關(guān)鍵點(diǎn)、(學(xué)習(xí),不是了解,是學(xué)習(xí))
(4)舉個(gè)推薦引擎中-應(yīng)用協(xié)同過(guò)濾的實(shí)踐案例。國(guó)外的產(chǎn)品案例。(包括如何使用,用什么公式,什么場(chǎng)景,有什么問(wèn)題,怎么解決,代碼層面附錄。PS:為什么選國(guó)外呢? 是因?yàn)檫@個(gè)推薦最早是應(yīng)用于國(guó)外,不管是算法還是理論層面,確實(shí)要比國(guó)內(nèi)深究多一分,覺(jué)得比較客觀,可以參考和適用更強(qiáng),這點(diǎn)可以跳著看。)
以上,個(gè)人認(rèn)為走推薦、畫(huà)像、搜索等PM核心要掌握第(1)~(3)部分。(公式可以除外。),其他策略PM們也可以關(guān)注各種的原理、特點(diǎn)、面試關(guān)鍵詞,以用來(lái)作為談資、需求籌碼、面試拔高、綜合素質(zhì)的層次跨越獲取高薪。
1. 集體智慧和協(xié)同過(guò)濾
什么是集體智慧
A. 原理和介紹
集體智慧 (Collective Intelligence) 并不是 移動(dòng)互聯(lián)網(wǎng)時(shí)代特有的,只是在 移動(dòng)互聯(lián)網(wǎng)時(shí)代,大家在 Web 應(yīng)用中利用集體智慧構(gòu)建更加有趣的應(yīng)用或者得到更好的用戶體驗(yàn)。
核心原理:
集體智慧是指在大量的人群的行為和數(shù)據(jù)中收集答案,幫助你對(duì)整個(gè)人群得到統(tǒng)計(jì)意義上的結(jié)論,這些結(jié)論是在單個(gè)個(gè)體上無(wú)法得到的,它往往是某種趨勢(shì)或者人群中共性的部分。
(PS:從上面可以知道,這里的“結(jié)論”是提取共性。這里的本質(zhì)應(yīng)用就可以是推薦系統(tǒng)的“人以群分,物以類(lèi)聚”思想。)
補(bǔ)充1:
集體智慧(Collective Intelligence,CI),簡(jiǎn)稱(chēng)集智,它是一種共享的或群體的智能。在互聯(lián)網(wǎng)時(shí)代之前就存在,可以分為兩面去看:
在網(wǎng)絡(luò)時(shí)代來(lái)臨之前,集體智慧就一直活躍在生物學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)、大眾行為學(xué)等領(lǐng)域 [1]? [2]? 。
隨著Web 2.0的崛起和社會(huì)性軟件的普及,集體智慧這在社交網(wǎng)絡(luò)服務(wù)、眾包、分享、評(píng)論和推薦等領(lǐng)域也得到了廣泛應(yīng)用 [3]? (典型案例包括:維基百科、百度百科、百度知道、豬八戒網(wǎng)、任務(wù)中國(guó)、Threadless、InnoCentive、digg、iStockphoto、Mechanical Turk等。)
補(bǔ)充2:
為什么會(huì)補(bǔ)充說(shuō)明這個(gè)。有2個(gè)原因,一是有些飯友不太清楚;二是我覺(jué)得這個(gè)概念其實(shí)很多公司、業(yè)務(wù)、產(chǎn)品在設(shè)計(jì)、在做策略、在做發(fā)展都離不開(kāi),多多少少會(huì)摻和到,所以拋出這個(gè)概念,可以讓大家注意到。
總之越來(lái)越多的傳統(tǒng)公司和組織也開(kāi)始使用各種集體智慧平臺(tái)或工具,借助外部智慧以解決復(fù)雜問(wèn)題。尤其現(xiàn)在主推的各種智能平臺(tái),智能城市、策略。
B. 從案例去看
Wikipedia 和 Google 是兩個(gè)典型的利用集體智慧的移動(dòng)互聯(lián)網(wǎng)應(yīng)用:
【W(wǎng)ikipedia】(維基百科)
入口:https://www.wikipedia.org/
Wikipedia 是一個(gè)知識(shí)管理的百科全書(shū)。(相對(duì)于傳統(tǒng)的由領(lǐng)域?qū)<揖庉嫷陌倏迫珪?shū))
Wikipedia 允許最終用戶貢獻(xiàn)知識(shí),隨著參與人數(shù)的增多,Wikipedia 變成了涵蓋各個(gè)領(lǐng)域的一本無(wú)比全面的知識(shí)庫(kù)。
在 Wikipedia 上,這種改版和修正被變?yōu)槊總€(gè)人都可以做的事情,任何人發(fā)現(xiàn)錯(cuò)誤或者不完善都可以貢獻(xiàn)他們的想法,即便某些信息是錯(cuò)誤的,但它一定也會(huì)盡快的被其他人糾正過(guò)來(lái)。從一個(gè)宏觀的角度看,整個(gè)系統(tǒng)在按照一個(gè)良性循環(huán)的軌跡不斷完善,這也正是集體智慧的魅力。
(補(bǔ)充:或許也許有人會(huì)質(zhì)疑它的權(quán)威性,但如果你從另一個(gè)側(cè)面想這個(gè)問(wèn)題,也許就可以迎刃而解。在發(fā)行一本書(shū)時(shí),作者雖然是權(quán)威,但難免還有一些錯(cuò)誤,然后通過(guò)一版一版的改版,書(shū)的內(nèi)容越來(lái)越完善。(飯友們可以回憶思考下。常見(jiàn)的個(gè)性化推薦產(chǎn)品,如電商,如頭條,網(wǎng)易等等,不管是推薦系統(tǒng)也好,搜索也罷,各種策略產(chǎn)品,是不是都說(shuō)你越使用、越反饋,越懂你,越精準(zhǔn),這里的本質(zhì)原理是“相通”的))
【Google】(姑姑,哈哈)
入口:https://www.google.com.hk/
Google:目前最流行的搜索引擎,與 Wikipedia 不同,它沒(méi)有要求用戶顯式的貢獻(xiàn),但仔細(xì)想想 Google 最核心的 PageRank 的思想,它利用了 Web 頁(yè)面之間的關(guān)系,將多少其他頁(yè)面鏈接到當(dāng)前頁(yè)面的數(shù)目作為衡量當(dāng)前頁(yè)面重要與否的標(biāo)準(zhǔn);
(補(bǔ)充:或許飯友們絕對(duì)這不好理解,那么你可以把它想象成一個(gè)選舉的過(guò)程,每個(gè) Web 頁(yè)面都是一個(gè)投票者同時(shí)也是一個(gè)被投票者,PageRank 通過(guò)一定數(shù)目的迭代得到一個(gè)相對(duì)穩(wěn)定的評(píng)分。Google 其實(shí)利用了現(xiàn)在 Internet 上所有 Web 頁(yè)面上鏈接的集體智慧,找到哪些頁(yè)面是重要的。 (飯友們同樣可思考下:這里的頁(yè)面上各種的鏈接,找到哪些頁(yè)面,是不是和我們很多內(nèi)容型產(chǎn)品,找到相似的內(nèi)容資料,如文章,如視頻等相似呢? 這里“投票者”其實(shí)可以理解是用戶對(duì)內(nèi)容的行為反饋))
(再補(bǔ)充:這里的web頁(yè)面不算僅指PC端,也是包含移動(dòng)端。更多是泛指產(chǎn)品中的每個(gè)”網(wǎng)絡(luò)頁(yè)面”。)
什么是協(xié)同過(guò)濾
怎么去理解呢?
協(xié)同過(guò)濾是利用集體智慧的一個(gè)典型方法。
(PS,協(xié)同過(guò)濾是推薦的核心算法,即集體智慧和推薦是關(guān)系的,個(gè)中原理參見(jiàn)上面所說(shuō)的)
要理解什么是協(xié)同過(guò)濾 (Collaborative Filtering, 簡(jiǎn)稱(chēng) CF),首先想一個(gè)簡(jiǎn)單的問(wèn)題:
如果你現(xiàn)在想看個(gè)電影,但你不知道具體看哪部,你會(huì)怎么做?
大部分的人會(huì)問(wèn)問(wèn)周?chē)呐笥?#xff0c;看看最近有什么好看的電影推薦,而一般更傾向于從口味比較類(lèi)似的朋友那里得到推薦。這就是協(xié)同過(guò)濾的核心思想。
核心原理:協(xié)同過(guò)濾一般是在海量的用戶中發(fā)掘出一小部分和你品位比較類(lèi)似的,在協(xié)同過(guò)濾中,這些用戶成為鄰居,然后根據(jù)他們喜歡的其他東西組織成一個(gè)排序的目錄作為推薦給你。
會(huì)遇到什么問(wèn)題?
當(dāng)然其中有一些核心的問(wèn)題:
如何確定一個(gè)用戶是不是和你有相似的品位?(數(shù)據(jù),動(dòng)作,用戶/內(nèi)容畫(huà)像)
如何將鄰居們的喜好組織成一個(gè)排序的目錄?(召回,排序,推薦)
如同第一章所說(shuō),同樣與集體智慧PK。可以發(fā)現(xiàn):
協(xié)同過(guò)濾相對(duì)于集體智慧而言,它從一定程度上保留了個(gè)體的特征,就是你的品位偏好,所以它更多可以作為個(gè)性化推薦的算法思想。
補(bǔ)充:所以可以想象,這種推薦策略在 移動(dòng)互聯(lián)網(wǎng) 的長(zhǎng)尾中是很重要的,將大眾流行的東西推薦給長(zhǎng)尾中的人怎么可能得到好的效果,
補(bǔ)充:所以回到推薦系統(tǒng)的一個(gè)核心問(wèn)題:了解你的用戶,然后才能給出更好的推薦。
2. 深入?yún)f(xié)同過(guò)濾的核心
前面作為背景知識(shí),介紹了集體智慧和協(xié)同過(guò)濾的基本思想,主要是為飯友們對(duì)推薦相關(guān)的打一些基礎(chǔ)和鋪墊。
接下來(lái),下面這一節(jié)將深入分析協(xié)同過(guò)濾的原理,介紹基于協(xié)同過(guò)濾思想的多種推薦機(jī)制,優(yōu)缺點(diǎn)和實(shí)用場(chǎng)景。
(核心1、面試問(wèn)題坑、需求反推工作量思考:協(xié)同過(guò)濾的基本核心有3個(gè)要素。)
首先,要實(shí)現(xiàn)協(xié)同過(guò)濾,需要一下幾個(gè)步驟:
收集用戶偏好
找到相似的用戶或物品
計(jì)算推薦
收集用戶偏好
A. 原理作用:
(口水話,面試、需求觀點(diǎn))
一句話:要從用戶的行為和偏好中發(fā)現(xiàn)規(guī)律,并基于此給予推薦。所以,如何收集用戶的偏好信息成為系統(tǒng)推薦效果最基礎(chǔ)的決定因素。(前者飯友PM都知道,后者是面試或需求中常會(huì)問(wèn))
B. 核心策略:如何收集呢?
(即用戶有很多方式向系統(tǒng)提供自己的偏好信息,而且不同的應(yīng)用也可能大不相同,下面舉例進(jìn)行介紹。以下可以作為需求分析、口徑定義使用。)
補(bǔ)充1:【面試坑:當(dāng)問(wèn)到具體的用戶偏好收集、如何定義行為、權(quán)重、正負(fù)反饋等相關(guān)問(wèn)題,實(shí)際就是這節(jié)相關(guān)內(nèi)容,所以下面的案例都可以參考回答,基本對(duì)全產(chǎn)品都通用,具有很強(qiáng)的適用性,】
補(bǔ)充2:有很多辦法和操作,具體業(yè)務(wù),具體產(chǎn)品都可能不太同。我也無(wú)法羅列完全,但挑選了業(yè)內(nèi)常用,實(shí)用性和發(fā)散性好的。
布爾值是“真” True 或“假” False 中的一個(gè)。代碼層有時(shí)也會(huì)在適當(dāng)時(shí)將值 True 和 False 轉(zhuǎn)換為 1 ...
a.?通用、標(biāo)準(zhǔn)的
用戶行為 | 類(lèi)型 | 特征 | 作用 |
評(píng)分 | 顯式 | 整數(shù)量化的偏好,可能的取值是 [0, n];n 一般取值為 5 或者是 10 | 通過(guò)用戶對(duì)物品的評(píng)分,可以精確的得到用戶的偏好 |
投票 | 顯式 | 布爾量化的偏好,取值是 0 或 1 | 通過(guò)用戶對(duì)物品的投票,可以較精確的得到用戶的偏好 |
轉(zhuǎn)發(fā) | 顯式 | 布爾量化的偏好,取值是 0 或 1 | 通過(guò)用戶對(duì)物品的投票,可以精確的得到用戶的偏好。 如果是站內(nèi),同時(shí)可以推理得到被轉(zhuǎn)發(fā)人的偏好(不精確) |
保存書(shū)簽 | 顯式 | 布爾量化的偏好,取值是 0 或 1 | 通過(guò)用戶對(duì)物品的投票,可以精確的得到用戶的偏好。 |
標(biāo)記標(biāo)簽(Tag) | 顯式 | 一些單詞,需要對(duì)單詞進(jìn)行分析,得到偏好 | 通過(guò)分析用戶的標(biāo)簽,可以得到用戶對(duì)項(xiàng)目的理解,同時(shí)可以分析出用戶的情感:喜歡還是討厭 |
評(píng)論 | 顯式 | 一段文字,需要進(jìn)行文本分析,得到偏好 | 通過(guò)分析用戶的評(píng)論,可以得到用戶的情感:喜歡還是討厭 |
點(diǎn)擊流? ( 查看 ) | 隱式 | 一組用戶的點(diǎn)擊,用戶對(duì)物品感興趣,需要進(jìn)行分析,得到偏好 | 用戶的點(diǎn)擊一定程度上反映了用戶的注意力,所以它也可以從一定程度上反映用戶的喜好。 |
頁(yè)面停留時(shí)間 | 隱式 | 一組時(shí)間信息,噪音大,需要進(jìn)行去噪,分析,得到偏好 | 用戶的頁(yè)面停留時(shí)間一定程度上反映了用戶的注意力和喜好,但噪音偏大,不好利用。 |
購(gòu)買(mǎi) | 隱式 | 布爾量化的偏好,取值是 0 或 1 | 用戶的購(gòu)買(mǎi)是很明確的說(shuō)明這個(gè)項(xiàng)目它感興趣。 |
b. 偏業(yè)務(wù):如內(nèi)容型(以騰訊視頻為例)
(上面已經(jīng)提過(guò)了。再舉個(gè)形象例子:你說(shuō)你很愛(ài)你女友;女友反問(wèn):你有多愛(ài)?如果女友是講情義的,那么你就給以前為她做過(guò)的DIY禮物打上最高權(quán)重,優(yōu)先展示說(shuō)出這些內(nèi)容;如果女友是講金錢(qián)的,那么你就準(zhǔn)備為她買(mǎi)過(guò)的、即將買(mǎi)的iPhoneXS送她,優(yōu)先物質(zhì)。權(quán)重,就是優(yōu)先級(jí),重要性。)
下面的,可以直接應(yīng)用到視頻平臺(tái)的推薦賦值,還是比較全面的。但是,我建議還是要思考到業(yè)務(wù)情況,賦值和權(quán)項(xiàng)范圍是要視情況調(diào)整。
? ? ? ?
c. 偏業(yè)務(wù):如服務(wù)型(以美團(tuán)為例)
用戶特征
人口屬性:用戶年齡,性別,職業(yè)等。
行為特征:對(duì)商戶/商圈/品類(lèi)的偏好(實(shí)時(shí)、歷史),外賣(mài)偏好,活躍度等。
建模特征:基于用戶的行為序列建模產(chǎn)生的特征等。
商戶特征
屬性特征:品類(lèi),城市,商圈,品牌,價(jià)格,促銷(xiāo),星級(jí),評(píng)論等。
統(tǒng)計(jì)特征:不同維度/時(shí)間粒度的統(tǒng)計(jì)特征等。
圖像特征:類(lèi)別,建模特征等。
業(yè)務(wù)特征:酒店房型等。
Query特征
分詞,意圖,與商戶相似度,業(yè)務(wù)特征等。
上下文特征
時(shí)間,距離,地理位置,請(qǐng)求品類(lèi),競(jìng)爭(zhēng)情況等。
廣告曝光位次。
(其他如電商也是同理,在這里就不一一梳理。有興趣可以看社區(qū)的用戶畫(huà)像、推薦等專(zhuān)輯內(nèi)容,里面有不同細(xì)分類(lèi)的梳理,由于這些是要結(jié)合,所以會(huì)相對(duì)分散到某個(gè)不同細(xì)分領(lǐng)域的產(chǎn)品或業(yè)務(wù)上。)
d. 總結(jié)-提取策略、方法論
(補(bǔ)充1:下面是對(duì)提上述的一些“收集特征、權(quán)重賦值”等抽象出“可復(fù)用”的思想。)
(補(bǔ)充2:)【面試坑、問(wèn)題點(diǎn)】
(關(guān)于策略類(lèi)PM都離不開(kāi)大數(shù)據(jù)的行為收集,特征定義。下面是對(duì)這些細(xì)分的總結(jié)。我梳理每個(gè)獨(dú)立的點(diǎn),都可以回答。回答的問(wèn)題范圍是“上述案例的一些“關(guān)鍵詞””,所以建議先回答下面的一些要點(diǎn),若面試官深挖再回答上面的細(xì)分案例。
(補(bǔ)充3:上述回答邏輯,即總-分-分原理,這樣有助于邏輯回答,也有助于符合面試的不斷深挖過(guò)程。盡量避免一開(kāi)始就回答具體,這樣會(huì)讓面試官一來(lái)問(wèn)的更細(xì),反而出現(xiàn)沒(méi)有學(xué)習(xí)和復(fù)盤(pán)到而出現(xiàn)更多意外,二來(lái)也是給各自心理門(mén)檻,即過(guò)三關(guān)心理,面試官深入問(wèn)的,你基本都能回答出。)
(下面不用產(chǎn)品這個(gè)詞,而是用“應(yīng)用”,泛指更多端的產(chǎn)品)
策略1:
以上列舉的用戶行為都是比較通用的、經(jīng)典業(yè)務(wù)的。但是如果是推薦、搜索等PM,是可以根據(jù)自己應(yīng)用(業(yè)務(wù)、產(chǎn)品)的特點(diǎn)添加特殊的用戶行為,并用他們表示用戶對(duì)物品的喜好。
策略2:
【方法論,面試可以分享,大大加分!】
在一般應(yīng)用中,提取的用戶行為一般都多于一種,關(guān)于如何組合這些不同的用戶行為,基本上有以下兩種方式:(策略、方法論)
【將不同的行為分組】:(假設(shè)以第一個(gè)案例為例),一般可以分為“查看”和“購(gòu)買(mǎi)”等等,然后基于不同的行為,計(jì)算不同的用戶 / 物品相似度。類(lèi)似于當(dāng)當(dāng)網(wǎng)或者 Amazon 給出的“購(gòu)買(mǎi)了該圖書(shū)的人還購(gòu)買(mǎi)了 ...”,“查看了圖書(shū)的人還查看了 ...”
【用戶、行為加權(quán)】:(假設(shè)以第二個(gè)案例為例),根據(jù)不同行為反映用戶喜好的程度將它們進(jìn)行加權(quán),得到用戶對(duì)于物品的總體喜好。(有些飯友聯(lián)系到畫(huà)像內(nèi)容,這里我要補(bǔ)充下:一般來(lái)說(shuō),顯式的用戶反饋比隱式的權(quán)值大,但比較稀疏,畢竟進(jìn)行顯示反饋的用戶是少數(shù);同時(shí)相對(duì)于“查看”,“購(gòu)買(mǎi)”行為反映用戶喜好的程度更大,但這也因應(yīng)用而異。)
【補(bǔ)充】:上面的全部,都可以作為針對(duì)“如何組合、提取用戶行為”的面試問(wèn)題,所表達(dá)的觀點(diǎn),這肯定會(huì)加分,并且這些都是關(guān)鍵知道思想。就如同可以理解成:共產(chǎn)黨以前走農(nóng)村包圍城市的戰(zhàn)略,其根本指導(dǎo)思想是:如論持久戰(zhàn)。? 所以上面1-3的例子是做法,那么作為策略PM一個(gè)核心的點(diǎn)是,你要學(xué)會(huì)有方法策略,怎么能遷移復(fù)用。這里的指導(dǎo)思想就如上面所說(shuō)的,雖然不一定說(shuō)完整全面,但對(duì)于大部分互聯(lián)網(wǎng)產(chǎn)品,都是這個(gè)原理】
策略3:
當(dāng)策略PM做到上面之后,也就是收集了用戶行為數(shù)據(jù)之后,接下來(lái)還需要對(duì)數(shù)據(jù)進(jìn)行一定的預(yù)處理。
【補(bǔ)充、面試問(wèn)題坑】
(常問(wèn)的問(wèn)題類(lèi)似:你覺(jué)得在收集數(shù)據(jù)(用戶數(shù)據(jù))、數(shù)據(jù)源等處理等等,要注意什么。或者遇到什么的坑,或者說(shuō)你是怎么想的,總之核心是“數(shù)據(jù)處理”。這個(gè)對(duì)于畫(huà)像PM等底層數(shù)據(jù)PM,一定會(huì)問(wèn)!)
【面試觀點(diǎn)、面試坑】其中最核心的工作就是:減噪和歸一化。
減噪:用戶行為數(shù)據(jù)是用戶在使用應(yīng)用過(guò)程中產(chǎn)生的,它可能存在大量的噪音和用戶的誤操作,可以通過(guò)經(jīng)典的數(shù)據(jù)挖掘算法過(guò)濾掉行為數(shù)據(jù)中的噪音,這樣可以是的分析更加精確。
(補(bǔ)充1:這里具體的方法,算法等細(xì)節(jié),可以參考用戶畫(huà)像等相關(guān)內(nèi)容,這話題又比較大,此處不展開(kāi)了。只要知道什么回事即可。)
歸一化:如前面講到的,在計(jì)算用戶對(duì)物品的喜好程度時(shí),可能需要對(duì)不同的行為數(shù)據(jù)進(jìn)行加權(quán)。但可以想象,不同行為的數(shù)據(jù)取值可能相差很大。
(例子1:比如,用戶的查看數(shù)據(jù)必然比購(gòu)買(mǎi)數(shù)據(jù)大的多,如何將各個(gè)行為的數(shù)據(jù)統(tǒng)一在一個(gè)相同的取值范圍中,從而使得加權(quán)求和得到的總體喜好更加精確,就需要進(jìn)行歸一化處理。)
(例子2:從以往實(shí)戰(zhàn)來(lái)看,最簡(jiǎn)單的歸一化處理:就是將各類(lèi)數(shù)據(jù)除以此類(lèi)中的最大值,以保證歸一化后的數(shù)據(jù)取值在 [0,1] 范圍中)。
(n同上補(bǔ)充的點(diǎn),這個(gè)相對(duì)抽象,飯友們可以結(jié)合我舉得例子去理解~)
(補(bǔ)充2:即上面所做,當(dāng)進(jìn)行的預(yù)處理后(這個(gè)一般可以和數(shù)據(jù)和開(kāi)發(fā)一起搞),根據(jù)不同應(yīng)用的行為分析方法,可以選擇分組或者加權(quán)處理,之后可以得到一個(gè)用戶偏好的二維矩陣,一維是用戶列表,另一維是物品列表,值是用戶對(duì)物品的偏好,一般是 [0,1] 或者 [-1, 1] 的浮點(diǎn)數(shù)值。)
(圖另外后面再配。就是數(shù)組矩陣的樣式,如果很抽象就簡(jiǎn)單理解成excel表左列右行的樣式。)
找到相似的用戶或物品
原理:當(dāng)已經(jīng)對(duì)用戶行為進(jìn)行分析得到用戶喜好后,可以根據(jù)用戶喜好計(jì)算相似用戶和物品,然后基于相似用戶或者物品進(jìn)行推薦。
目前主流的,都是圍繞最典型的 CF 的兩個(gè)分支:
基于用戶的 CF
基于物品的 CF
【策略1、面試問(wèn)題:】
這兩種方法都有個(gè)共同核心:就是都需要計(jì)算相似度。
所以,下面先看看最基本的幾種計(jì)算相似度的方法。
(由于涉及到計(jì)算,那就肯定會(huì)有各種公式。否則根本不能說(shuō)算法。所以下面有相關(guān)的技術(shù)細(xì)節(jié),可能有技術(shù)和算法邏輯強(qiáng)的PM能看得很明白。但沒(méi)有這方面基礎(chǔ)的,也沒(méi)關(guān)系,下面我梳理都會(huì)按大白話和盡可能了解的語(yǔ)言去講述原理)
(補(bǔ)充:還是要說(shuō)個(gè)很現(xiàn)實(shí)的事情。這篇依然有一丟的技術(shù)術(shù)語(yǔ),PM不理解或者不明白是很正常的,但如果連百度、連問(wèn)查找都不愿意,那談何學(xué)習(xí)和成長(zhǎng)呢?要知道,你薪資漲幅高低、大廠公司offer等依然有一堆PM在與你競(jìng)爭(zhēng)。)
A. 相似度的計(jì)算
策略1:
【面試細(xì)節(jié)】關(guān)于相似度的計(jì)算,現(xiàn)有的幾種基本方法都是基于向量(Vector)的。(飯友其實(shí)簡(jiǎn)單理解,也就是計(jì)算兩個(gè)向量的距離,距離越近相似度越大。)
計(jì)算相似度 邏輯1:(面試細(xì)節(jié))
在推薦的場(chǎng)景中,在用戶 - 物品偏好的二維矩陣中:
可以將一個(gè)用戶對(duì)所有物品的偏好作為一個(gè)向量來(lái)計(jì)算用戶之間的相似度
或者將所有用戶對(duì)某個(gè)物品的偏好作為一個(gè)向量來(lái)計(jì)算物品之間的相似度
B. 相似鄰居的計(jì)算
上面介紹完相似度的計(jì)算公式,
【邏輯、面試坑、@開(kāi)發(fā)RD交流細(xì)節(jié):】
下面看看如何根據(jù)相似度找到用戶 - 物品的鄰居:常用的挑選鄰居的原則可以分為兩類(lèi):
固定數(shù)量的鄰居:K-neighborhoods 或者 Fix-size neighborhoods
【原理】:不論鄰居的“遠(yuǎn)近”,只取最近的 K 個(gè),作為其鄰居。(下面是流程、邏輯想法)
如圖 1 中的 A,假設(shè)要計(jì)算點(diǎn) 1 的 5- 鄰居,那么根據(jù)點(diǎn)之間的距離,取最近的 5 個(gè)點(diǎn),分別是點(diǎn) 2,點(diǎn) 3,點(diǎn) 4,點(diǎn) 7 和點(diǎn) 5。
但很明顯可以看出,這種方法對(duì)于孤立點(diǎn)的計(jì)算效果不好。
【核心問(wèn)題,如果細(xì)節(jié)會(huì)問(wèn)到-即為什么的解答】因?yàn)橐」潭▊€(gè)數(shù)的鄰居,當(dāng)它附近沒(méi)有足夠多比較相似的點(diǎn),就被迫取一些不太相似的點(diǎn)作為鄰居,這樣就影響了鄰居相似的程度。(比如圖 1 中,點(diǎn) 1 和點(diǎn) 5 其實(shí)并不是很相似。)
基于相似度門(mén)檻的鄰居:Threshold-based neighborhoods
【原理】:與計(jì)算固定數(shù)量的鄰居的原則不同,基于相似度門(mén)檻的鄰居計(jì)算是對(duì)鄰居的遠(yuǎn)近進(jìn)行最大值的限制,落在以當(dāng)前點(diǎn)為中心,距離為 K 的區(qū)域中的所有點(diǎn)都作為當(dāng)前點(diǎn)的鄰居。
這種方法計(jì)算得到的鄰居個(gè)數(shù)不確定,但相似度不會(huì)出現(xiàn)較大的誤差。
如圖 1 中的 B,從點(diǎn) 1 出發(fā),計(jì)算相似度在 K 內(nèi)的鄰居,得到點(diǎn) 2,點(diǎn) 3,點(diǎn) 4 和點(diǎn) 7。
【核心觀點(diǎn),問(wèn)為什么認(rèn)為好】這種方法計(jì)算出的鄰居的相似度程度比前一種優(yōu),尤其是對(duì)孤立點(diǎn)的處理。? ? ?
計(jì)算推薦
經(jīng)過(guò)前期的計(jì)算已經(jīng)得到了相鄰用戶和相鄰物品。
下面介紹如何基于這些信息為用戶進(jìn)行推薦。
本系列的上半場(chǎng),已經(jīng)簡(jiǎn)要介紹過(guò)基于協(xié)同過(guò)濾的推薦算法可以分為基于用戶的 CF 和基于物品的 CF,所以按邏輯去看,下面深入這兩種方法的計(jì)算方法。
PM主要關(guān)注是:計(jì)算的基本原理、使用場(chǎng)景和優(yōu)缺點(diǎn)。(這個(gè)是高頻面試問(wèn)法、考點(diǎn),讓你介紹下原理思想。)
A. 基于用戶的 CF(User CF)
基于用戶的 CF 的基本思想相當(dāng)簡(jiǎn)單!
【原理】:基于用戶對(duì)物品的偏好找到相鄰鄰居用戶,然后將鄰居用戶喜歡的推薦給當(dāng)前用戶。
計(jì)算就是將一個(gè)用戶對(duì)所有物品的偏好作為一個(gè)向量來(lái)計(jì)算用戶之間的相似度(找領(lǐng)居)
找到 K 鄰居后,根據(jù)鄰居的相似度權(quán)重以及他們對(duì)物品的偏好,(看鄰居偏好)
預(yù)測(cè)當(dāng)前用戶沒(méi)有偏好的未涉及物品,計(jì)算得到一個(gè)排序的物品列表作為推薦。(召回排序)
以上,作為面試或者分享你對(duì)這個(gè)原理的看法,絕對(duì)是可以用。
(下圖就是一個(gè)例子,對(duì)于用戶 A,根據(jù)用戶的歷史偏好,這里只計(jì)算得到一個(gè)鄰居 - 用戶 C,然后將用戶 C 喜歡的物品 D 推薦給用戶 A。)
B. 基于物品的 CF(Item CF)
基于物品的 CF 的原理和基于用戶的 CF 類(lèi)似!!!
【原理】:只是在計(jì)算鄰居時(shí)采用物品本身,而不是從用戶的角度,即基于用戶對(duì)物品的偏好找到相似的物品,然后根據(jù)用戶的歷史偏好,推薦相似的物品給他。
從計(jì)算的角度看,就是將所有用戶對(duì)某個(gè)物品的偏好作為一個(gè)向量來(lái)計(jì)算物品之間的相似度,(找用戶偏好的“共性”物品)
得到物品的相似物品后,根據(jù)用戶歷史的偏好預(yù)測(cè)當(dāng)前用戶還沒(méi)有表示偏好的物品,計(jì)算得到一個(gè)排序的物品列表作為推薦。(預(yù)測(cè)召回,排序)
(舉個(gè)例子,如圖 3 ,對(duì)于物品 A,根據(jù)所有用戶的歷史偏好,喜歡物品 A 的用戶都喜歡物品 C,得出物品 A 和物品 C 比較相似,而用戶 C 喜歡物品 A,那么可以推斷出用戶 C 可能也喜歡物品 C。)
C. User CF vs. Item CF
前面介紹了 User CF 和 Item CF 的基本原理,下面分幾個(gè)不同的角度深入看看它們各自的優(yōu)缺點(diǎn)和適用場(chǎng)景:
【計(jì)算復(fù)雜度】(Item CF 和 User CF 是基于協(xié)同過(guò)濾推薦的兩個(gè)最基本的算法)
User CF 是很早以前就提出來(lái)了,Item CF 是從 Amazon(亞馬遜,成為市值第一的公司,不是沒(méi)有道理的...) 的論文和專(zhuān)利發(fā)表之后(2001 年左右)開(kāi)始流行。
大家都覺(jué)得 Item CF 從性能和復(fù)雜度上比 User CF 更優(yōu),其中的一個(gè)主要原因就是:
對(duì)于一個(gè)在線網(wǎng)站,用戶的數(shù)量往往大大超過(guò)物品的數(shù)量,同時(shí)物品的數(shù)據(jù)相對(duì)穩(wěn)定,因此計(jì)算物品的相似度不但計(jì)算量較小,同時(shí)也不必頻繁更新。(但只是適用一些電商)
但往往忽略了這種情況只適應(yīng)于提供商品的電子商務(wù)網(wǎng)站,對(duì)于新聞,博客或者微內(nèi)容的推薦系統(tǒng),情況往往是相反的,物品的數(shù)量是海量的,同時(shí)也是更新頻繁的。
【面試挖坑】:用戶海量、內(nèi)容物品海量,因此要看產(chǎn)品實(shí)際情況而去使用相應(yīng)的協(xié)同過(guò)濾算法,不能一概而論。所以單從復(fù)雜度的角度,這兩個(gè)算法在不同的系統(tǒng)中各有優(yōu)勢(shì),推薦引擎的設(shè)計(jì)者需要根據(jù)自己應(yīng)用的特點(diǎn)選擇更加合適的算法。
【適用的場(chǎng)景】場(chǎng)景策略:在非社交網(wǎng)絡(luò)的網(wǎng)站中:內(nèi)容內(nèi)在的聯(lián)系是很重要的推薦原則,它比基于相似用戶的推薦原則更加有效。
可以看到,在這種情況下我認(rèn)為有幾個(gè)很重要的點(diǎn):(場(chǎng)景策略)
Item CF 的推薦成為了引導(dǎo)用戶瀏覽的重要手段 。(比如在當(dāng)當(dāng)網(wǎng)(購(gòu)書(shū)網(wǎng)站)上,當(dāng)你看一本書(shū)的時(shí)候,推薦引擎會(huì)給你推薦相關(guān)的書(shū)籍,這個(gè)推薦的重要性遠(yuǎn)遠(yuǎn)超過(guò)了網(wǎng)站首頁(yè)對(duì)該用戶的綜合推薦。)
同時(shí) Item CF 便于為推薦做出解釋。(在一個(gè)非社交網(wǎng)絡(luò)的網(wǎng)站中,給某個(gè)用戶推薦一本書(shū),同時(shí)給出的解釋是某某和你有相似興趣的人也看了這本書(shū),這很難讓用戶信服,因?yàn)橛脩艨赡芨静徽J(rèn)識(shí)那個(gè)人;但如果解釋說(shuō)是因?yàn)檫@本書(shū)和你以前看的某本書(shū)相似,用戶可能就覺(jué)得合理而采納了此推薦。)
相反的,在現(xiàn)今很流行的社交網(wǎng)絡(luò)站點(diǎn)中,User CF 是一個(gè)更不錯(cuò)的選擇,User CF 加上社會(huì)網(wǎng)絡(luò)信息,可以增加用戶對(duì)推薦解釋的信服程度。
推薦多樣性和精度
一般來(lái)說(shuō),剛開(kāi)始研究推薦引擎的學(xué)者們?cè)谙嗤臄?shù)據(jù)集合上分別用 User CF 和 Item CF 計(jì)算推薦結(jié)果,發(fā)現(xiàn)推薦列表中,只有 50% 是一樣的,還有 50% 完全不同。
(但是這兩個(gè)算法確有相似的精度,所以可以說(shuō),這兩個(gè)算法是很互補(bǔ)的。具體怎么度量,可以參考下面梳理的幾個(gè)方面。一是整體的度量方法,而是不同的業(yè)務(wù)指標(biāo))
【度量策略-兩種經(jīng)典方法】
(PS無(wú)涉及具體業(yè)務(wù),可通用)
【補(bǔ)充1:面試坑】:常問(wèn)到的:如你如何衡量推薦效果好不好? 從技術(shù)指標(biāo)?業(yè)務(wù)指標(biāo)如何看? 不同業(yè)務(wù)下又如何觀察,驗(yàn)證? 改善?。
補(bǔ)充:2類(lèi)似的可以以前飯團(tuán)的內(nèi)容,如:
【重要】衡量個(gè)性化推薦產(chǎn)品效果的核心指標(biāo)有哪些?
【實(shí)踐】淺析建立個(gè)性化推薦數(shù)據(jù)指標(biāo)體系&實(shí)踐(以電商為例)
關(guān)于推薦的多樣性,有兩種度量方法:
第一種度量方法:是從單個(gè)用戶的角度度量。
就是說(shuō)給定一個(gè)用戶(見(jiàn)下補(bǔ)充),查看系統(tǒng)給出的推薦列表是否多樣。(直觀)
也就是要比較推薦列表中的物品之間兩兩的相似度,不難想到,對(duì)這種度量方法,Item CF 的多樣性顯然不如 User CF 的好,因?yàn)?Item CF 的推薦就是和以前看的東西最相似的。
(補(bǔ)充1 ,可作為面試細(xì)節(jié):這里的用戶,一般在我們PM可以叫白名單用戶、隨機(jī)用戶、抽樣用戶、分組測(cè)試用戶、體驗(yàn)用戶都可以~? 具體看業(yè)務(wù)規(guī)則策略。如我以前做這方面驗(yàn)證會(huì)分兩種情況:如特定場(chǎng)景會(huì)分組用戶測(cè)試(側(cè)重是對(duì)場(chǎng)景的驗(yàn)證,白名單)、如果是走量測(cè)試機(jī)率、抗壓等等,就導(dǎo)出隨機(jī)大量。后者一般有條件都可以聯(lián)合用戶畫(huà)像去勾選某些條件的用戶群))
第二種度量方法是考慮系統(tǒng)的多樣性,也被稱(chēng)為覆蓋率 (Coverage),它是指一個(gè)推薦系統(tǒng)是否能夠提供給所有用戶豐富的選擇。
在這種指標(biāo)下,Item CF 的多樣性要遠(yuǎn)遠(yuǎn)好于 User CF(因?yàn)?User CF 總是傾向于推薦熱門(mén)的),從另一個(gè)側(cè)面看,也就是說(shuō),Item CF 的推薦有很好的新穎性,很擅長(zhǎng)推薦長(zhǎng)尾里的物品。
所以,盡管大多數(shù)情況,Item CF 的精度略小于 User CF, 但如果考慮多樣性,Item CF 卻比 User CF 好很多。
【PK的實(shí)踐分析】
【面試策略:在面試的時(shí)候,尤其剛?cè)腴T(mén)推薦的PM可能會(huì)問(wèn)到深入:你為什么說(shuō)UCF和ICF是這樣,為什么就說(shuō)它的多樣性會(huì)更好... 這時(shí)候,你需要有一些的原理、實(shí)踐策略反推出支撐】
所以,存在上面的情況,或者是如果對(duì)推薦的多樣性還心存疑惑,
那么下面再舉個(gè)實(shí)例看看 User CF 和 Item CF 的多樣性到底有什么差別。
(補(bǔ)充:我按思考的金字塔原理梳理以下幾點(diǎn)。每一點(diǎn)都可以作為單獨(dú)“結(jié)論”。即假設(shè)談需求、面試的時(shí)候:你針對(duì)這個(gè)類(lèi)似問(wèn)題可以回答以下的任一點(diǎn)。如果他細(xì)問(wèn)再聯(lián)系上下幾點(diǎn)。當(dāng)然,你熟悉之外就請(qǐng)隨便搭,這樣的方法只是方便對(duì)這方面基礎(chǔ)不太扎實(shí)的PM)
【個(gè)人推薦的順序是: 1-2、 2、1-3,都可以用于作答】
首先,假設(shè)每個(gè)用戶興趣愛(ài)好都是廣泛的,喜歡好幾個(gè)領(lǐng)域的東西,不過(guò)每個(gè)用戶肯定也有一個(gè)主要的領(lǐng)域,對(duì)這個(gè)領(lǐng)域會(huì)比其他領(lǐng)域更加關(guān)心。
給定一個(gè)用戶,假設(shè)他喜歡 3 個(gè)領(lǐng)域 A,B,C,A 是他喜歡的主要領(lǐng)域,這個(gè)時(shí)候來(lái)看 User CF 和 Item CF 傾向于做出什么推薦。
如果用 User CF, 它會(huì)將 A,B,C 三個(gè)領(lǐng)域中比較熱門(mén)的東西推薦給用戶,而如果用 ItemCF,它會(huì)基本上只推薦 A 領(lǐng)域的東西給用戶。
那么看到因?yàn)?User CF 只推薦熱門(mén)的,所以它在推薦長(zhǎng)尾里項(xiàng)目方面的能力不足,而 Item CF 只推薦 A 領(lǐng)域給用戶,這樣他有限的推薦列表中就可能包含了一定數(shù)量的不熱門(mén)的長(zhǎng)尾物品,同時(shí) Item CF 的推薦對(duì)這個(gè)用戶而言,顯然多樣性不足。
但是對(duì)整個(gè)系統(tǒng)而言,因?yàn)椴煌挠脩舻闹饕d趣點(diǎn)不同,所以系統(tǒng)的覆蓋率會(huì)比較好。
【可以得出】(在相似問(wèn)題回答以下)從上面的分析,可以很清晰的看到:這兩種推薦都有其合理性,但都不是最好的選擇,因此他們的精度也會(huì)有損失。
【怎么優(yōu)化、解決?】其實(shí)對(duì)這類(lèi)系統(tǒng)的最好選擇是:如果系統(tǒng)給這個(gè)用戶推薦 30 個(gè)物品,既不是每個(gè)領(lǐng)域挑選 10 個(gè)最熱門(mén)的給他,也不是推薦 30 個(gè) A 領(lǐng)域的給他,而是比如推薦 15 個(gè) A 領(lǐng)域的給他,剩下的 15 個(gè)從 B,C 中選擇。
解決策略:所以結(jié)合 User CF 和 Item CF 是最優(yōu)的選擇。
結(jié)合的基本原則就是:當(dāng)采用 Item CF 導(dǎo)致系統(tǒng)對(duì)個(gè)人推薦的多樣性不足時(shí),通過(guò)加入 User CF 增加個(gè)人推薦的多樣性,從而提高精度,而當(dāng)因?yàn)椴捎?User CF 而使系統(tǒng)的整體多樣性不足時(shí):可以通過(guò)加入 Item CF 增加整體的多樣性,同樣同樣可以提高推薦的精度。
用戶對(duì)推薦算法的適應(yīng)度
(補(bǔ)充:這個(gè)是補(bǔ)充。畢竟之前更多是談引擎特性去考慮,除了上面小談?dòng)脩?#xff0c;我在這也梳理相關(guān)的,作為補(bǔ)充。)
【面試坑、策略】:
策略:以下可以作為用戶視覺(jué)的“推薦引擎、推薦策略”相關(guān)問(wèn)題的想法,記住是想法!具體怎么說(shuō),除了按我梳理的邏輯順序,也可以自己去按理解去表達(dá)。由于站在用戶角度,就是上帝角度,只要結(jié)合了推薦算法的特性,怎么回答都可以。
坑:切記!不要說(shuō)用戶覺(jué)得爽就行了,也不要說(shuō)看指標(biāo)就很不錯(cuò)了!不要單單的說(shuō)怎樣怎樣就好,一定要結(jié)合推薦引擎本身!客觀的說(shuō)! 切記切記~? 否則你就跳坑了~? 此坑適用于其他的策略PM面試。
回到來(lái)說(shuō),前面大部分都是從推薦引擎的角度考慮哪個(gè)算法更優(yōu),(面試或者談需求時(shí),如果不懂技術(shù)或者細(xì)節(jié),也可以拔高的回答:其實(shí),我認(rèn)為更多的應(yīng)該考慮作為推薦引擎的最終使用者 -- 應(yīng)用用戶對(duì)推薦算法的適應(yīng)度。)
對(duì)于 User CF:
推薦的原則:是假設(shè)用戶會(huì)喜歡那些和他有相同喜好的用戶喜歡的東西;
但如果一個(gè)用戶沒(méi)有相同喜好的朋友,那 User CF 的算法的效果就會(huì)很差,所以一個(gè)用戶對(duì)的 CF 算法的適應(yīng)度是和他有多少共同喜好用戶成正比的。
對(duì)于Item C:
Item CF 算法也有一個(gè)基本假設(shè):就是用戶會(huì)喜歡和他以前喜歡的東西相似的東西,那么可以計(jì)算一個(gè)用戶喜歡的物品的自相似度。
邏輯1:一個(gè)用戶喜歡物品的自相似度大,就說(shuō)明他喜歡的東西都是比較相似的,也就是說(shuō)他比較符合 Item CF 方法的基本假設(shè),那么他對(duì) Item CF 的適應(yīng)度自然比較好;
邏輯2:反之,如果自相似度小,就說(shuō)明這個(gè)用戶的喜好習(xí)慣并不滿足 Item CF 方法的基本假設(shè),那么對(duì)于這種用戶,用 Item CF 方法做出好的推薦的可能性非常低。
D. 小結(jié):
以上的介紹,相信飯友小伙伴們,起碼已經(jīng)對(duì)協(xié)同過(guò)濾推薦的各種方法,原則,特點(diǎn)和適用場(chǎng)景有深入,60%的了解,那就可以了。
3. 總結(jié)
【算法理論、思想的口水話、面試點(diǎn):】
移動(dòng)互聯(lián)網(wǎng)的一個(gè)核心思想就是“集體智慧”,基于協(xié)同過(guò)濾的推薦策略的基本思想就是基于大眾行為,為每個(gè)用戶提供個(gè)性化的推薦,從而使用戶能更快速更準(zhǔn)確的發(fā)現(xiàn)所需要的信息。
【產(chǎn)品角度口水話、面試交流點(diǎn):】
從產(chǎn)品角度分析,現(xiàn)今比較成功的推薦引擎,比如 Amazon(鼻祖),豆瓣(早期),頭條(最近發(fā)起者)、網(wǎng)易云、QQ、阿里淘寶、JD等都采用了協(xié)同過(guò)濾的方式,現(xiàn)在很多大廠、主流場(chǎng)景都用了混搭方式。但核心還是玩協(xié)同過(guò)濾的多,不管如何,后期都離不開(kāi)這一步。
其中類(lèi)似維基百科這些,計(jì)算出來(lái)的推薦是開(kāi)放的,可以共用他人的經(jīng)驗(yàn),很好的支持用戶發(fā)現(xiàn)潛在的興趣偏好。
基于協(xié)同過(guò)濾的推薦策略也有不同的分支,它們有不同的實(shí)用場(chǎng)景和推薦效果,PM可以根據(jù)自己產(chǎn)品、業(yè)務(wù)應(yīng)用的實(shí)際情況選擇合適的方法,異或組合不同的方法得到更好的推薦效果。
點(diǎn)擊“閱讀原文”看今日話題
作為用戶為什么會(huì)喜歡關(guān)閉APP通知?
總結(jié)
以上是生活随笔為你收集整理的推荐策略产品经理:剖析协同过滤(千人千面推荐的核心 )的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 如何设计出一个有灵魂的「签到功能」?
- 下一篇: 写给未来产品总监的一封信