神策数据 VP 张涛:个性化推荐从入门到精通(附推荐产品经理修炼秘籍)
本文內(nèi)容來自于近期神策數(shù)據(jù)舉辦的《智能推薦——應用場景與技術難點剖析》閉門會上的分享內(nèi)容整理,分享者為神策數(shù)據(jù)副總裁張濤,曾就職于騰訊、映客和豌豆莢等知名互聯(lián)網(wǎng)公司。
大家好,我是張濤,在加入神策數(shù)據(jù)之前的 10 年中,我一直在 C 端產(chǎn)品中從事產(chǎn)品設計和運營管理相關的工作,做的產(chǎn)品包括工具類、電商類、內(nèi)容類等,在這個過程中,關于搜索推薦操盤過很多實踐的項目,有從 0 開始做的,也有在中后期介入做優(yōu)化迭代的。因此,今天關于推薦的分享可能不那么偏技術視角,這有一個好處,是幫助產(chǎn)品和運營人員更加了解推薦,也讓技術更了解業(yè)務產(chǎn)品視角下的推薦。
今天的分享將為大家解答以下幾個問題。你的公司是否適合采用個性化推薦?如果需要個性化推薦,該如何做好?產(chǎn)品運營在參與到一個推薦系統(tǒng)的構建當中,有哪些常見的坑?有哪些可以避開這些坑的一些簡單方法?以及如何修煉成一個優(yōu)秀的推薦產(chǎn)品經(jīng)理?
一、 “四個關鍵”為你揭開推薦系統(tǒng)的神秘面紗
個人認為,推薦系統(tǒng)是根據(jù)用戶以及不同的場景差異,對信息進行合理的排序、過濾,解決信息過載問題的一套機制。這個定義中包含四個關鍵點,如下:
1.“根據(jù)用戶以及不同的場景差異”
對于很多剛開始做推薦的人可能會忽略這一點,大部分人在思考推薦時想的更多的可能是基于用戶來做,但其實我從眾多實踐中發(fā)現(xiàn),很多時候推薦產(chǎn)生價值不僅僅只是說以用戶進行區(qū)分,相關場景的差異會對于最后推薦效果產(chǎn)生巨大的影響。
2.“推薦的本質(zhì)是對信息進行合理的排序、過濾”
很多人認為推薦是一個魔盒,非常神奇,其實究其本質(zhì)是企業(yè)有成千上萬甚至上億的 item,不管這些 item 是文章、視頻,還是電商里面的商品,然后現(xiàn)在有某個人在一個具體的場景里面,企業(yè)需要把這些 item 給他看,那應該把哪個放在第一個?這就是推薦系統(tǒng)背后的運作原理。
3. “推薦系統(tǒng)要解決信息過載的問題”
舉個例子,如果你的企業(yè)只做爆款商品,整個公司只賣兩個商品,這樣用戶一看就明白了,顯然也不需要推薦,所以做推薦的一個前提條件是你公司本身提供的業(yè)務里面的信息太多了,對于一個正常的自然人來說,他處理不了那么多信息的時候,企業(yè)才需要去幫助用戶解決信息過載的問題,從而為用戶設計這樣一套機制。
4.“一套機制”
這點很好理解,推薦系統(tǒng)是由不同的算法、規(guī)則等構成的一套機制。這四點是我從產(chǎn)品視角為你解讀了什么是推薦系統(tǒng),以及他的一些簡單作用。
二、推薦系統(tǒng)、廣告系統(tǒng)、搜索系統(tǒng)三者有何不同?
事實上,解決我在前面提到的一系列問題,推薦系統(tǒng)并不是唯一的方法。比如,前面所提到的排序、過濾,做技術的同學應該很容易聯(lián)想到,搜索和廣告系統(tǒng)也涉及排序、過濾,且搜索也一定程度上解決了信息過載。那么,這三個系統(tǒng),它到底有什么區(qū)別呢?我從 5 個方面對其進行了對比,下面將一一講述:
1.用戶獲取信息的方式。
廣告與推薦系統(tǒng),用戶都是被動的,但搜索不一樣,用戶是主動搜索的,他需要輸入一些關鍵詞,會加入一些自己的意見和重點。
2.點擊率要求。
這三個系統(tǒng)對點擊率都有要求,僅在要求上有些區(qū)別,這就不詳述了。
3.驚喜度要求。
對于廣告和搜索系統(tǒng)來說,不需要太多的驚喜度。比如,如果我搜一個關鍵詞,搜索到我想要的資料時,并不會覺得很驚喜,甚至認為是理所當然,但是在推薦系統(tǒng)里,用戶往往對驚喜度是有要求的。
具體來說,用戶對于一個推薦系統(tǒng)的期望是希望產(chǎn)品能夠給他們一些驚喜,如用戶 A 雖然不知道產(chǎn)品用了什么數(shù)據(jù)、什么方法,但如果突然推薦了一首可能他已經(jīng)快遺忘的自己卻很喜歡的歌時,他就會因感到產(chǎn)品“好懂我”而驚喜。
4.個性化要求。
在廣告和搜索系統(tǒng),個性化的需求是可有可無的,不管有沒有系統(tǒng)也能正常運作。但是,對于推薦系統(tǒng)來說,個性化要求非常高,甚至越高越好。因為個性化推薦針對的是差異化的單個場景,一定會有個性化的要求。
5.用戶反饋。
廣告和搜索系統(tǒng)存在比較隱性的反饋,即對于搜索結果好不好?一般很少有搜索引擎廠商會直接問用戶,你喜不喜歡搜索結果,更多是廠商去判定廣告效果和搜索效果,一般是通過 CTR,或通過整個產(chǎn)品的某些長期留存表現(xiàn)來判定。但是,對于推薦系統(tǒng)來說,很多推薦產(chǎn)品會直接地問用戶的喜好,存在很明顯的顯性主觀表達。
因此,同樣是解決類似的一系列問題。 但是這三個不同的系統(tǒng)存在極大的差異(如下圖),這些區(qū)別直接決定了企業(yè)去判斷某個業(yè)務適不適合使用個性化推薦,以及該如何做好個性化推薦。
三、什么樣的產(chǎn)品或業(yè)務適合采用個性化推薦?
個人認為,具有媒體性的產(chǎn)品(Media Product)適合使用個性化推薦,這里指的不是只有與媒體相關的才能使用推薦,公司業(yè)務為電商的就不行,其實它只是一個概念,包含四個點,但不一定要同時滿足,下面我將一一解說。
1.口味很重要(Taste)
產(chǎn)品中的 Taste 本身很重要。舉個例子,網(wǎng)上曾有一個很火的梗,在淘寶搜索連衣裙,排在第二位的連衣裙價格,代表了在整個淘寶體系里判定你個人的客單價范圍。我們當時試了一下,發(fā)現(xiàn)一個特別有趣的現(xiàn)象,就是一般女生搜索出來的價格都會很低,大概一兩百元,而我和一些男同事搜索出來會高很多,如我搜索的基本上是一千八左右的連衣裙,仔細想一想也有原因,像女生天天逛淘寶,大大小小什么商品都買,但我上淘寶基本上都是要買相機、電腦,這些價格都在幾千或上萬元。很容易發(fā)現(xiàn),我們所有人對于買的東西的方向和口味是有差異的。
事實上除了存在差異還存在要求,很多人不希望被一個平臺判定其口味是某個方向。比如一個具備推薦系統(tǒng)的網(wǎng)站總給你推薦一些下三濫、低俗的東西,他會想“天哪!我是這樣一個人嗎?”因此,大家對于一個平臺的口味和自己的口味都是有要求的。
2.單位成本不重要(Cost)
“單位成本不重要”我們可以通過這個例子來理解,比如以前我們每天看報紙,因為報紙的單價較便宜,對應到現(xiàn)在的產(chǎn)品,比如我聽一首歌、看一篇文章、買一個常規(guī)的商品,你的消費行為的 cost 消耗都不高,且不那么重要。
3.有瀑布效應(Information Cascade)
瀑布效應指的是,一旦在社區(qū)或平臺里產(chǎn)生了一個趨勢,那么整個平臺的其他人都會跟隨這個趨勢,比如,微博上轉發(fā)超過三四千的動態(tài),可能會慢慢地被轉發(fā)的更多,整個社區(qū)會形成這樣的一些趨勢和傾向,瀑布效應在平臺和社區(qū)較容易形成。
4.多樣性(Diversity)
這一點指的是你的平臺的內(nèi)容本身是具有多樣性的,這是推薦的基礎。如果整個平臺的內(nèi)容在各種維度、屬性上都一致,那么很難做推薦。
基本上,只要滿足以上 1-2 個點,我們就可以說它是一個偏媒體型的產(chǎn)品。這方面一個很經(jīng)典的例子,我們可以看下圖,在圖中的王守崑是原來負責豆瓣最早的推薦系統(tǒng)的架構師,這是他在很早之前分享中的一頁 PPT,我覺得這是講一個產(chǎn)品適不適合上推薦最直觀的一個例子。
當時他們在做豆瓣推薦的時候,首先思考到底應該優(yōu)先在什么頻道上推薦,為此設置了一個判斷的標準,開始列一些指標,如下:
豆瓣會根據(jù)各個頻道的用戶數(shù)、條目數(shù)(豆瓣收錄的圖書、電影、音樂多少)計算稀疏性,比如圖書的條目數(shù)是 300 萬,同時記錄圖書用戶群體人均會在豆瓣收藏幾本書(點看過的視為收藏),豆瓣用人均的看過的次數(shù)除以總的條目數(shù)算出的值叫做稀疏性。如果一個產(chǎn)品稀疏性太低,那么繼續(xù)使用現(xiàn)行的推薦系統(tǒng)的相關算法就會出現(xiàn)問題,因為整個待推薦的內(nèi)容面臨很大的群體,如果每一個人喜歡的東西太少時,他就會散落在整個大群體的各個方面,你很難找到人和人之間具體的關系,因為每個人在整個系統(tǒng)里面的表達興趣太少了。因此,稀疏性低的產(chǎn)品做推薦,要么是工程難度比較高,那么效果可能不太好,一般說稀疏性高一點的產(chǎn)品更容易找到人與人之間契合的東西,當然稀疏性也不能過高,如果稀疏性達到百分之八九十,那所有的用戶可能就過于相似,所以豆瓣比較強調(diào)稀疏性。
關于多樣性,有一個有趣的點需要注意。比如圖書的多樣性高,大家可能理解圖書僅根據(jù)一個偵探小說就能分出幾十個類型;電影的多樣性低,好像和常規(guī)的理解不一樣,事實上因為電影現(xiàn)在是高度工業(yè)化和商業(yè)化的產(chǎn)品,他們的類型聚集度是相當高的。所以這給了大家一個啟示,在判斷自身產(chǎn)品時,不要完全憑直覺,而要真的拿自己公司的實際數(shù)據(jù)說話。
時效性很好理解,我就不解釋了。反饋是指在某個品類中,企業(yè)做出一個推薦行為,用戶什么時候能給企業(yè)一個反饋,也就是用戶表達自己喜好的反饋時間周期是快還是慢。比如圖書就會很慢,讀完可能需要十天半個月,拖延癥的人可能還要讀半年左右;文章就會很快,只要點我的文章就可以定義為偏好,把這篇文章滾動到底就是喜歡;音樂也是,聽完就是喜歡,很快跳過就是不喜歡。
最后,豆瓣會綜合前面所有的這些維度屬性來判斷推薦效果。在圖中他們認為推薦效果最好的是單曲,原因是單曲的稀疏性特別高,雖然多樣性相對來說低級別,但是因為稀疏性高,加上反饋周期特別快,綜合起來效果最好。事實上,這也是為什么大家在互聯(lián)網(wǎng)的花花世界中,還能記得豆瓣 FM 這個產(chǎn)品。不過,豆瓣在其他方面的推薦效果也不錯,比如圖書。
以上,就是豆瓣當時內(nèi)部的一個評估過程,揭示了企業(yè)想要做一個推薦產(chǎn)品的時,到底該如何去衡量這個業(yè)務適不適合做,效果將怎樣,需要定一個衡量的標準。
四、以商業(yè)為目的,推薦要做成什么樣?
推薦的商業(yè)目的一般分為以下幾種:
1.用計算機經(jīng)驗取代運營經(jīng)驗(節(jié)省成本、提高效率)
這一點非常重要,很多人提到推薦系統(tǒng)會認為是由公司的技術部門負責,像變魔法一樣,就把某個事情從人工運營變成了機器運營,然后運營的同學就好像沒活干了,但事實不是如此,其實本質(zhì)上來說它是取代運營經(jīng)驗,但是有個前提條件是你們公司本來有運營經(jīng)驗,我很少見到公司使用推薦系統(tǒng)是完全拋開運營團隊,單靠技術團隊自己的力量,把推薦系統(tǒng)運作得很好。
事實上,我們可以這樣理解這一點:運營積累了一些經(jīng)驗,但是只能通過運營人工的進行一次次干預,這樣往往只能對整個區(qū)域進行干預,沒有辦法把經(jīng)驗落地到每一個具體的用戶身上,干預每一個用戶的體驗還是很難。因此,推薦系統(tǒng)就可以幫助解決提升每個用戶的體驗問題。
2.充分利用流量(提高變現(xiàn)能力)
事實上,很多企業(yè)的產(chǎn)品設計以及各種運營方案,可能只能解決眾多流量的其中 60% 的需求,另外 40% 的需求被忽略了,或者是不得不忽略,因為企業(yè)沒有辦法給每一個用戶或者每一群用戶單獨配一個運營。此時,推薦系統(tǒng)就可以起到類似分流量的精細化運營的作用。
3.促進信息流動(留住小眾用戶)
這個價值點可能很多企業(yè)沒有注意到,因為大多數(shù)想使用個性化推薦的公司,都在考慮公司如何賺錢?或用戶如何能得到更好的體驗?但是,很多產(chǎn)品的推薦系統(tǒng)還有一個很重要的作用是促進信息流動,從而留住小眾用戶。在很多形態(tài)的產(chǎn)品中,不管是社區(qū)型的產(chǎn)品,還是電商型的產(chǎn)品,它都會存在一些商品,如果產(chǎn)品的機制運營的不錯,這些商品會在短時間之內(nèi)成為整個社區(qū)的話題和爆款。
但是可能社區(qū)本身的積淀或產(chǎn)品的話題程度,不可能讓它持續(xù)地成為話題,但是一定要制造話題,因為其一可以彰顯整個社區(qū)多樣性,其二小眾的群體也覺得自己能在大平臺得到展現(xiàn),會更容易留下來,但如果整個社區(qū)缺乏這種能力,展示在推薦位置的永遠是熱門的大眾內(nèi)容,那么長尾的小眾社區(qū)、小眾用戶、小眾商品就會涌入其他平臺,企業(yè)便很難養(yǎng)起來那一部分的風。
回到當下來看,像抖音這樣的產(chǎn)品,為什么能夠讓那么多人參與進去?核心在于聚集了多樣化的用戶,比如經(jīng)常在抖音上看到一些播放量、點贊量都是幾十萬的用戶,你點進去他的主頁來看歷史的視頻播放,你會發(fā)現(xiàn)這個用戶可能只有那一個視頻幾十萬,其他的視頻只有幾百、幾千的播放量。但這就是推薦系統(tǒng)的魅力,用戶不需要一直是一個大 V,只要偶爾一個內(nèi)容能夠成為爆款,那么平臺就能夠把這類用戶篩選出來,讓他吸引更多的人參與進來,而避免說被少數(shù)的大 V、頭部流量把整個平臺給遏制住,這是一個比較有意思的商業(yè)目的。
五、產(chǎn)品、運營必知的推薦系統(tǒng)算法
這里是針對常見的一些做推薦的基礎思想和算法進行簡單的掃盲(之后神策數(shù)據(jù)公眾號會有一篇文章“推薦系統(tǒng)的實踐與思考”會對最新的一些推薦系統(tǒng)的架構構建進行專門的介紹),以下三種是比較常見的:
協(xié)調(diào)過濾(CF)、隱語義模型(LFM)、優(yōu)勢排行(Edgerank),我們最常見到的是CF、其中 Edgerank 主要用于類似 Facebook 做社交的企業(yè)。
1.協(xié)調(diào)過濾(CF)
事實上,大部分的推薦系統(tǒng)的本質(zhì)是“物以類聚,人以群分”,思路大概可分為兩個方面:其一,研究物品,即研究被推薦系統(tǒng)推薦的 item 進行推薦,被稱為基于物品的推薦(Item-based);其二,研究人,即根據(jù)人的喜好進行推薦,被稱為基于用戶的推薦(User-based)。
基于物品的協(xié)同過濾是什么意思呢?舉個例子,某個電商企業(yè)的商品 i 和 j 被同一類人喜歡,因此可以將其歸為一類,當用戶 u 喜歡 i 但是沒有看過 j,就可以把 j 推薦給 u。
基于用戶的協(xié)同過濾又是什么意思呢?前面提到的物品的協(xié)同過濾是先把物品歸為一類,然后再推薦相同類的,而基于用戶的協(xié)調(diào)過濾是我們先分析用戶。舉個例子,我們把用戶 A 和 B 歸為一類,然后,就可以把 B 喜歡的商品,A 還沒看過的 i 也推薦給 A。
2.隱語義模型(LFM)
隱語義模型相對協(xié)同過濾會復雜一些,但是本質(zhì)上也較相似,這根據(jù)用戶的行為和物品的特征,用機器學習的方法先把物品進行分類,然后再計算用戶 A 對每一個類別的興趣程度。舉個例子,某個企業(yè)通過機器學習把物品分成了十個類,然后該企業(yè)計算用戶 A 對每個類別的興趣程度,可以劃分為 1、0.8、0.7、0.5、0.3 等。之后,企業(yè)繼續(xù)計算一個物品 i 對于每個類別的權重,也就是物品 i 到底該被劃分到哪個類別,最后,企業(yè)根據(jù)這兩個信息和權重計算出用戶對物品 i 的喜愛程度。相比協(xié)同過濾,LFM 分的更精細,事實上,現(xiàn)實中不管是人的屬性還是物品的屬性都千差萬別,很難通過單純的把物品或人分為一類就能滿足推薦的需求。
3.優(yōu)勢排行(Edgerank)
Edgerank 是 Facebook 完全基于自身信息流分發(fā)構建的一個算法。這能幫助大家理解有時候推薦算法不是簡單采用市面上恒定的算法,而要根據(jù)公司實際的需求調(diào)整。Edgerank 會算三個指標:親密度(Affinity Score)、邊的權重(Edge Weight)、新鮮程度(Time Decay)。
親密度(Affinity Score)。比如用戶 A 發(fā)了一些文字信息、視頻、圖片等,用戶 B 從一些第三方應用分享的這些文字、視頻、圖片來到用戶 A 的信息流,Facebook 就會首先算用戶 B 與用戶 A 的親密程度(同學?情侶?曾經(jīng)互動過?),通過系統(tǒng)來計算出 AS 的親密度分數(shù),當判定為存在親密度,就會再計算邊的權重。
邊的權重(Edge Weight)。這指的是用戶 B 通過什么樣子的邊連接到你,是圖片?文字?還是通過分享自己喜歡的文章,像這種不同的連接類型,叫做邊。 邊的權重的不同會幫助更好的推薦。舉個例子,如果發(fā)現(xiàn) Facebook 的用戶更喜歡看照片,照片的邊的權重就會更高;如果用戶總發(fā)一些沒有營養(yǎng)的雞湯文,這些文章邊的權重就會下降。
新鮮程度(Time Decay)指的是內(nèi)容本身的發(fā)布時間的早晚,越近發(fā)布的權重會越高。
Facebook 會綜合這三個指標給用戶做推薦,但是對大多數(shù)企業(yè)來說無法直接套用,因為這是根據(jù) Facebook 自身信息流的分發(fā)需求提煉出的影響因子。
之所以為大家介紹這三種模型,是想讓大家簡單了解現(xiàn)在做推薦的常規(guī)手段,但事實上現(xiàn)在的工程實踐遠比上面的這些基礎模型復雜,我們再來看一下推薦系統(tǒng)的架構圖,這不是純技術角度的架構圖,比較偏產(chǎn)品視角。事實上,做推薦系統(tǒng)往往是一個過程,通過多種算法得到一個初步結果,然后再對初步結果進行過濾、排序,再生成一些推薦原因,最后展示推薦結果。在整個過程里面,產(chǎn)品運營參與的環(huán)節(jié)也比較多,這就是我的一個理解。
六、個性化推薦產(chǎn)品經(jīng)理的修煉秘籍
做推薦系統(tǒng)往往不是一蹴而就的,中間會有很多失敗的因素。我認為常見的失敗原因主要分為三個方向:數(shù)據(jù)質(zhì)量、太過魯莽、不理解用戶。
很多公司讓我?guī)兔ε袛嗍欠襁m合做推薦時,往往發(fā)現(xiàn)公司在數(shù)據(jù)層面上沒有什么積累。比如有些企業(yè)完全沒有統(tǒng)一的地方存儲用戶信息,可能分散在不同系統(tǒng)、不同部門。這導致做推薦建模時,完全不知道數(shù)據(jù)在哪找。還有些企業(yè)用戶的行為信息保存太少,基本上只有一些關鍵交易信息保留,但整個交易的前置環(huán)節(jié),比如用戶在首頁搜索哪些關鍵詞?在一個頁面詳情頁上反復瀏覽了幾次?是否添加購物車?是否使用優(yōu)惠券?類似這些信息全部沒有保存。雖然推薦系統(tǒng)中的某些關鍵行為非常重要,但是大部分的推薦系統(tǒng)中的關鍵行為極少。
對于推薦系統(tǒng)來說,數(shù)據(jù)越多越好。很多公司,你會發(fā)現(xiàn)其用戶行為數(shù)據(jù)收集的相當少。除此之外,當我?guī)退麄儼褦?shù)據(jù)找全了想合到一起來使用,卻發(fā)現(xiàn)合不到一起。比如,公司的瀏覽數(shù)據(jù)沒有記錄 UID,直接只記錄了網(wǎng)站上的 cookie,因此只能用 cookie 來判定用戶訂單,但訂單后臺直接記錄了用戶的 UID 或訂單號,多個數(shù)據(jù)源之間沒有統(tǒng)一的 ID 識別機制,企業(yè)無法把用戶的行為數(shù)據(jù)、業(yè)務數(shù)據(jù)連通。 這些主要是數(shù)據(jù)質(zhì)量導致推薦系統(tǒng)失敗的原因,缺少一個好的數(shù)據(jù)基礎打地基。
過于魯莽和不理解用戶也是企業(yè)會常犯的錯誤,這些會在下面的秘籍中體現(xiàn)。
秘籍 1 :明確推薦場景
當大家做推薦系統(tǒng)時,一定要想明白推薦的場景是什么?頭條因個性化推薦而爆火,很多人一想到推薦可能就是信息流,這就是過于魯莽的判定,但其實推薦場景有很多,比如信息流、猜你喜歡、關聯(lián)推薦以及針對不同的用戶推薦不同的產(chǎn)品界面等。
舉個例子,現(xiàn)在同樣的一個產(chǎn)品,可能 Web 端、移動端都有入口,甚至還存在車載設備的入口等。那么,同樣的產(chǎn)品功能,在這三個場景下給用戶推薦肯定應該有所不同,而且往往是當產(chǎn)品、運營認知到了這種區(qū)別之后,反饋到算法部門,讓他們進行調(diào)整最終得到某些效果進行對比,不難發(fā)現(xiàn)對于這點,認知的經(jīng)驗效果遠比調(diào)節(jié)算法的細節(jié)來得更加有用。
另一個典型的例子是用戶在售前、售中、售后的不同場景,針對其整個作用的方向不一樣。
比如,企業(yè)做商品推薦,在售前應該推薦什么商品,能把用戶的興趣激發(fā)出來?售中有什么策略能促進用戶盡快下單?售后又該怎么做?如果用戶剛剛買了一個電視機,又被推薦買另外一個電視機,就是一個典型的糟糕的推薦場景。事實上,用戶處在不同周期,推薦算法要解決的問題是不一樣的,推薦邏輯也隨之不同,所以推薦算法要根據(jù)用戶在你產(chǎn)品的生命周期進行不同的設計。
秘籍 2:明確目標
這一點指的是推薦系統(tǒng)能解決的問題,個人認為,可以分為從眾、興趣、發(fā)現(xiàn)三個方向。
解決從眾的需求
很多人認為“從眾”是貶義詞,事實上,我們大部分人從生理和心理上都有從眾的需求,因為從眾是人追求安全感的一個體現(xiàn),所以推薦系統(tǒng)首先解決從眾需求。比如,讓產(chǎn)品的推薦能告訴用戶在這個社區(qū)里面現(xiàn)在最流行什么,來幫助其跟隨潮流,從而獲得歸屬感和安全感,這個需求通常是穩(wěn)定的,而且非常重要。
解決興趣的需求
簡單來說,這個平臺上有很多內(nèi)容,但時間、精力有限,用戶只想看與自己興趣相關的。
解決發(fā)現(xiàn)的需求
如果產(chǎn)品上的內(nèi)容我看的差不多了,有沒有點新鮮的內(nèi)容,這就是發(fā)現(xiàn)的需求。比如,我是一個愛好做模型的人,但該網(wǎng)站上關于模型的內(nèi)容已經(jīng)看的差不多了,網(wǎng)站給我推薦了一些我可能感興趣,但不是模型相關的內(nèi)容來解決我發(fā)現(xiàn)的需求。
以上就是推薦系統(tǒng)解決的三方面需求目標,不同的目標與之相關的要求也不一樣。
對于從眾的需求來說,企業(yè)希望用戶的滿意度非常高。當你推薦的流行內(nèi)容如果被用戶發(fā)現(xiàn)不是最近流行的,用戶的滿意度就會很低。然而,對于發(fā)現(xiàn)的需求來說,企業(yè)對滿意度要求就沒有那么高,用戶自己的預期也不會那么高,所以有時候?qū)τ诎l(fā)現(xiàn)的需求,企業(yè)為用戶推薦錯一個或者推薦一個沒那么滿意的東西,用戶很可能會認為機器猜錯了很正常,不會介意。就推薦準確率而言,從眾一般準確率較低,因為用戶不會對所有流行的內(nèi)容都會仔細查看,但是,興趣的準確率就要求很高。對于覆蓋率,從眾因為是迎合整個社區(qū)的潮流需求,覆蓋率肯定是低的。而興趣因為針對不同的人來覆蓋不同的興趣,覆蓋的會越來越多。發(fā)現(xiàn)往往能使產(chǎn)品中很多可能冷門的庫存內(nèi)容重新得到展示。以此類推,多樣性、新穎性、驚喜度也是類似。
因此,如果你的企業(yè)使用推薦系統(tǒng),從這個三個方向,最后的考核指標完全不一樣。舉個例子,我們經(jīng)常聽到產(chǎn)品現(xiàn)在的目標是提高用戶收聽時長,但逐漸會發(fā)現(xiàn)產(chǎn)品處于不同階段,推薦的目標是完全不一樣的,就個人經(jīng)驗總結,一個正常產(chǎn)品的發(fā)展軌跡往往如下圖。
推薦系統(tǒng)一般最開始都是為了解決從眾的需求,也就是如何把社區(qū)中流行、熱門的內(nèi)容盡可能地通過推薦系統(tǒng)篩選出來,讓更多的人來看。然后慢慢地用戶增加,產(chǎn)品內(nèi)容越來越豐富,便需要做更精細化的運營,這個階段更注重推薦系統(tǒng)解決單個群體或單個用戶的興趣需求。最后,產(chǎn)品在后期逐漸穩(wěn)定時便要著手于發(fā)現(xiàn)。
舉個例子,機核網(wǎng)是神策數(shù)據(jù)的一個客戶,一個專注游戲文化的媒體網(wǎng)站,我是其忠實用戶,第一次接觸時,我被網(wǎng)站上的深度文章所吸引,我花了大概半年多的時間,把歷史文章、電臺、視頻內(nèi)容都看了一遍,這個時候作為一個老用戶,已經(jīng)把我興趣范圍之內(nèi)的東西探索的差不多了,產(chǎn)品提供的價值受到了限制,這個時候企業(yè)便需要使用推薦系統(tǒng)去解決和發(fā)現(xiàn)一些需求,如何讓這一批老用戶能夠在產(chǎn)品中找到一些新東西,激發(fā)新的需求變得非常重要。所以,往往做推薦系統(tǒng)會分為幾個階段。
秘籍 3:大膽拍腦袋
在工作中,很多時候不可避免的需要拍腦袋。下圖是 Facebook 的首席產(chǎn)品官 Chris Cox 說的一句話。
大概意思是,在最開始,News feedranking 是 Facebook 最核心的時間流,他們像扳開關一樣,有時認為圖片的權重不夠高,就把圖片權重調(diào)高一點,然后把故事權重調(diào)低一點。比如可能一個圖片值五分,如果一個用戶加入某個小組只值一分。事實上,給這些行為打 5 分與 1 分沒有特別科學的說法,但是,剛開始一定要大膽的拍腦袋,而不是大家都停在一個點,什么都不做。
有時候做推薦系統(tǒng),關于某些關鍵行為的權重該如何設置的問題,如果產(chǎn)品運營完全不參與,把這個問題推給技術,技術有時候?qū)I(yè)務的理解沒有那么深,他可能傾向于用一個很復雜的算法來算權重。
當然,最好的方式更多還是需要產(chǎn)品給技術更多的輸入。如果產(chǎn)品告訴技術,在產(chǎn)品里面用戶很喜歡圖片,可以先把圖片權重調(diào)高一點,把故事權重調(diào)低一點,技術按照這個規(guī)則先嘗試一下,事實上,在推薦系統(tǒng)整個開發(fā)迭代過程中經(jīng)常會反復的調(diào)高調(diào)低權重,并且在這個實踐應用過程中也會發(fā)現(xiàn)其中的優(yōu)劣勢。
再舉個例子,之前我在 A 站早期帶 A 站的時候,因為當時還較小,養(yǎng)不起一個算法團隊,所以我們買了市面上的一些黑盒推薦服務,企業(yè)只需要提供數(shù)據(jù),服務商就可以把推薦結果給你,最終發(fā)現(xiàn)效果特別差,而且你想做相關的調(diào)整把某個受歡迎的頻道權重調(diào)高一點,但因為是純黑盒推薦,企業(yè)自身根本無法直接調(diào)整,或企業(yè)給服務商提需求,可能需要等幾個月才能拿到結果,那么推薦的最終效果就很難保證。所以即使市面上有很多黑盒推薦,接入成本也比較低,但企業(yè)會發(fā)現(xiàn)推薦系統(tǒng)不是一個接入一次就完成的事情,推薦系統(tǒng)需要在這個過程中不斷地去調(diào)整,不斷地根據(jù)業(yè)務去反饋。
因此,企業(yè)在拍腦袋的時候,需要產(chǎn)品和運營定義到底哪些「用戶行為」更重要、或者意味著什么,這是靠機器無法做的。比如,用戶看一篇文章滾動到底部,機器并不會認為這有什么價值,但我們會認為該用戶對這篇文章真的感興趣。也就是一個無用的信息,加入了人工的判斷認知之后,就可能變成在整個推薦系統(tǒng)里很關鍵的信號。這個系統(tǒng)里還有很多這種類似的行為需要人為的給這些行為打上一個標記,判定為喜歡或不喜歡的信號,這種信號極其重要,不是大家想象的推薦是根據(jù)一些很明確的行為定義的,很多用戶的喜歡和不喜歡判斷都不是用戶主動表達出來的,都是依靠產(chǎn)品、運營、技術一起研究業(yè)務、用戶流程推斷出來的。
那么行為如何彰顯喜歡程度或者討厭程度呢?舉個例子,對于電商產(chǎn)品,通常會認為一個用戶對于商品的興趣表達公式是:購買遠大于收藏,收藏大于瀏覽。在做推薦系統(tǒng)時,這些權重就需要考慮進去。
秘籍 4:反復檢閱推薦結果
企業(yè)不是只要推薦系統(tǒng)上線就可以了,還需要反復檢閱推薦結果。一般檢閱分兩種:離線和在線。
第一個是在線的檢閱。在線檢閱的核心是企業(yè)要理解用戶的行為模式,產(chǎn)品要像用戶一樣去用自身的產(chǎn)品以及推薦模塊,設身處地感受一下現(xiàn)在推薦的內(nèi)容是否是自己想要的,如果推薦的內(nèi)容不是想看的,就需要和運營、技術溝通,為什么這次推薦的是一個我不想看的內(nèi)容,就是你要把推薦放到一個實際的場景里,真正地自己去體會去理解用戶的行為。
第二個是離線的檢閱。過去做產(chǎn)品時,我們有時候會仔細分析給用戶推薦的歷史結果中是否存在一些很明顯的 Bad case,這也是企業(yè)改善推薦質(zhì)量很常見的一種方式。
豆瓣電臺過去做中文英文曲庫分割就是一個典型例子,當時豆瓣的收聽率一直無法上升,最后豆瓣員工進入用戶狀態(tài),換位思考發(fā)現(xiàn)有些人喜歡聽中文歌,完全不喜歡英文歌,而還有些人喜歡聽英文歌,卻反感中文歌。從推薦角度思考,只需要做一個簡單的事,把中文跟英文的曲風直接區(qū)隔開,區(qū)隔開后豆瓣的推薦準確率瞬間提升。
另外一個例子是,有一次我們做商品推薦遇到了瓶頸,我們采取了一個方法,在每次推薦批次的商品中加入幾個 10 元包郵或 20 元包郵的商品,最后整個點擊率、轉化率都提升了,這并不是科學的方法,但當企業(yè)做一些在線的體驗優(yōu)化或是離線的?Bad case?校驗時,你會發(fā)現(xiàn)一些粗暴的解決方法,但是這些對于整體的效果提升很有效。
秘籍 5:多學習一些算法知識
非技術出身的產(chǎn)品、運營,如果真的想把推薦業(yè)務做好,建議學一些算法知識,至少簡單知道每一個算法的基本優(yōu)劣勢,這樣才能為你的優(yōu)化方向提供目標和思路,溝通更順暢,更容易碰撞出火花。
比如,當做協(xié)同過濾的推薦系統(tǒng)時,當企業(yè)有 6000 萬的歷史用戶,平均每個人喜歡十個商品,但是只能推薦 1000 萬個商品。對于沒有做過推薦系統(tǒng)的大部分人,對其背后的的工程難度是無法想象的,但是你需要配合工程師去理解,如果你不理解工程難度在哪,就提不出比較好的建議。
比如產(chǎn)品、運營需要知道,過熱、過冷、太 low 是一些很常見的?Bad case。過熱指的是推薦的永遠是很重要的內(nèi)容;過冷就是總推薦一些最冷門的內(nèi)容,導致用戶點擊率低;太 low,也是很常見的,內(nèi)容質(zhì)量低,用戶不喜歡。這也是我認為有時候產(chǎn)品運營參與推進業(yè)務可以幫助技術解決的一個特別好的點。在我做產(chǎn)品時,一旦發(fā)現(xiàn)有?Bad case,就直接干掉,在這過程中不僅優(yōu)化了整個推薦的質(zhì)量,還通過不斷地干掉這個動作本身發(fā)現(xiàn)一些問題和規(guī)律。
再分享一個經(jīng)典問題——如何做冷啟動?現(xiàn)在已經(jīng)集中在幾個大概的方向:1.主動收集,讓用戶去選一些感興趣的一些方向,如豆瓣注冊后讓你選擇感興趣的類目;2.被動收集,如在淘寶網(wǎng)頁收集用戶的一些點擊、瀏覽等行為數(shù)據(jù)。
七、推薦系統(tǒng)的未來走向
下面簡單聊聊我對推薦系統(tǒng)的未來走向的想法。事實上,現(xiàn)在的一些企業(yè)的推薦系統(tǒng),大部分算法都是混合發(fā)揮作用的,也就是復合算法。企業(yè)還可以在復合算法基礎上加入競爭機制,如在同樣一個推薦場景,多個窗口同時運作,這些窗口之間存在相互競爭,最后判定在同一個場景下,到底哪個算法、推薦機制更有效果。又或者企業(yè)直接使用機器學習,機器學習會自主做一些 utem、 item 的建模,甚至是算法之間的競爭關系。
事實上,相比我在 2008 年剛入行的時,現(xiàn)在的推薦系統(tǒng)已經(jīng)非常復雜,我認為之后這些會更復雜、越來越抽象,如今任何一個公司想自己從 0 開始做推薦系統(tǒng)都會非常困難。但是不管基于我過去的產(chǎn)品經(jīng)驗,還是現(xiàn)在在神策數(shù)據(jù)的經(jīng)驗,總結發(fā)現(xiàn)其實構建推薦系統(tǒng)的價值觀、企業(yè)對于自己公司業(yè)務的理解,在整個推薦的搭建過程當中起著至關重要的作用。
以上就是我的全部分享,希望對你有幫助!
不容錯過的精彩內(nèi)容
深入淺出理解神經(jīng)網(wǎng)絡召回模型的優(yōu)勢
媽媽幫×神策智能推薦,打造人性化智趣母嬰服務
個性化推薦之召回的方法
重磅!一文解讀神策智能推薦
戳此,告訴我,你在看?
總結
以上是生活随笔為你收集整理的神策数据 VP 张涛:个性化推荐从入门到精通(附推荐产品经理修炼秘籍)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 深入浅出理解神经网络召回模型的优势
- 下一篇: 周四话运营:如何提高用户留存?