隐性语义索引(LSI)
生活随笔
收集整理的這篇文章主要介紹了
隐性语义索引(LSI)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1.Introduction
在向量模型中,將查詢和文檔均表示成同一空間下的向量,可以使用余弦相似度進行評分計算。但是,向量空間表示方法沒有能力處理自然語言理解中的兩個經典問題:一詞多義(polysemy)和一義多詞(synonymy)。使用LSI可以利用詞項的共現情況,將詞和文檔映射到潛在語義空間,從而去除了原始向量空間中的一些“噪音”,提高了信息檢索的精確度。
2.SVD分解
文檔集可以轉換成詞項-文檔矩陣,每一行代表一個詞項,每一列代表一個文檔,矩陣元素(t,d)代表詞項t在文檔d中出現的次數。將詞項-文檔矩
《新程序員》:云原生和全面數字化實踐50位技術專家共同創作,文字、視頻、音頻交互閱讀總結
以上是生活随笔為你收集整理的隐性语义索引(LSI)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 目标检测(Object Detectio
- 下一篇: SHA1和MD5算法详解和源码