关于Rocchio算法和向量空间模型反馈
生活随笔
收集整理的這篇文章主要介紹了
关于Rocchio算法和向量空间模型反馈
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
什么是相關反饋以及向量空間檢索模型在此不敘。
Rocchio公式是這樣的,省掉不相關部分,因為相關部分更重要。
有研究表明,在用戶只反饋一兩篇相關文檔的情況下,如果用戶同時標明文檔中的哪些段落是相關的,并允許檢索系統將相關段落而不是整個相關文檔的向量表示加入到原始查詢中,那么相關反饋的效果會明顯提高,為什么呢?
請先看下圖
標明哪些段落是相關的,也就相當于增加了相關的索引詞,通過公式計算出的新的查詢向量的值也就更加合理,關于相關索引詞的相似度也就更大,故檢索效果會顯著提高。
2.同一研究表明,一旦用戶返回了足夠的反饋結果(比如10-20篇相關文檔),同時并沒有標明文檔中哪些段落是相關的,如果使用整個相關文檔的向量加入到原始查詢中,系統同樣可以得到很好的效果,解釋其中的原因。
不標明段落相關,但是把整個相關文檔向量加入到原始查詢中,根據公式仍然可以知道,這將大大提高新的查詢向量關于相關文檔的相似度,從而提高檢索效果。
參考文獻
http://www.docin.com/p-116849541.html
總結
以上是生活随笔為你收集整理的关于Rocchio算法和向量空间模型反馈的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: BM算法的shift1表是在所有情况下移
- 下一篇: Linux makefile中的= :=