算法工程师如何改进豆瓣电影
生活随笔
收集整理的這篇文章主要介紹了
算法工程师如何改进豆瓣电影
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
影迷們經常關注的電影排行榜里,一部由100人評出9.0分的電影,和一部由10000人評出8.0分的電影,誰應該排在前面呢?
這是我們算法工程師時常會面對的問題。
一些深度影迷可能會想到 imdb.com (互聯網電影數據庫) 所采用的貝葉斯公式[見附注],這個公式的思路就是通過每部影片的[評分人數]作為調節排序的杠桿:如果這部影片的評分人數低于一個預設值,則影片的最終得分會向全部影片的平均分拉低。
由此可見,平衡評分人數和得分,避免小眾高分影片排前,是這個計算方法的出發點。可問題在于:調節整個榜單的排序主要依賴于這個[評分人數預設值]。如果它設置的很低,那么最終的排序結果,就是每部影片自身評分從高到低在排序;如果它被設置得過高,那么只適用高曝光率的影片。據說 imdb.com 的這個預設值從500一路調整到了25000,遺憾的是這個算法仍然無法很好的解決他們的問題。
我們看看國內電影市場的現狀。2013年上映的《瘋狂原始人》兩個月內在豆瓣電影得到了13萬人次的評分,而1974年上映的《教父2》,到目前為止的評分總人數還不到10萬人。近幾年觀影方式的多樣化以及影院觀影的持續火爆,使得新近上映的影片很輕松地就能獲得大量的評分,相較之下&#x
總結
以上是生活随笔為你收集整理的算法工程师如何改进豆瓣电影的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为什么程序员需要关心顺序一致性(Sequ
- 下一篇: 一些比较好的资源