ad hoc检索 routing检索
ad hoc
類似于圖書館里的書籍檢索,即書籍庫(數據庫)相對穩定不變,不同用戶的查詢要求是千變萬化的。這種檢索就稱為ad
hoc。基于Web的搜索引擎也屬于這一類。
routing
用戶的查詢要求相對穩定。在routing中,查詢常常稱為profile,也就是通常所說的興趣,用戶的興趣在一段時間內是穩定不變的,但是數據庫(更確切的說,是數據流)是不斷變化的。這種任務很象我們所說的新聞定制什么的,比如用戶喜歡體育,這個興趣在一段時間內是不變的,而體育新聞在不斷變化。
二者的關系和區別
- ad hoc和routing代表了IR的兩個不同研究方向。前者的主要研究任務包括對大數據庫的索引查詢、查詢的擴展等等;而后者的主要任務不是索引,而是對用戶興趣的建模,即如何對用戶興趣建立合適的數學模型
隨著TREC的不斷進行,TREC的任務有所變更,總的來說還是上面兩類,不過名稱有所變化,后者不再稱為routing,而是稱為filtering,routing本身成為filtering的一個子任務,filtering還有其它兩個子任務adaptive
filtering 和 batch filtering。前者對每個用戶興趣(用topic描述)僅有很少的正例,甚至沒有
正例,后者給出的正例很多。adaptive filtering允許對用戶的興趣不斷反饋(adaptive的含義),batch
filtering因每次TREC的要求不同,有時可以反饋,有時不允許反饋。在不允許反饋的情況下,batch
filtering實際就是個靜態分類的過程。routing和batch filtering基本上一樣,不同的是,routing返回的
結果要排序,而batch filtering的結果是個集合,是不需要排序的,因為有排序,所以兩者的評測方法也不同。batch
filtering可以通過類recall/precision的方法進行評估,而routing的評測方法與ad hoc任務有些相似,因為通常的
ad hoc任務的返回結果也是要求排序的。
現在ad hoc retrieval的研究重點:
(1) 查詢(query)的擴展(即如何使得query更貼近topic)和
(2) 匹配(相似度計算),
總結
以上是生活随笔為你收集整理的ad hoc检索 routing检索的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java基础----IO-----第四天
- 下一篇: 蓝桥杯算法训练KAc给糖果贪心-pyth