R语言模糊匹配
模糊匹配是指根據名詞中字符的相似特征,將兩個相似的名詞進行匹配,以獲取另一個表中對應名詞的屬性數據。
相同名詞之間的匹配可以參考以前的一篇文章(利用R解決常見的數據匹配問題),但是現實中,由于數據來源不同,同一對象的名稱可能不同,但兩個名稱之間仍有一定的相似性,本文利用分詞、投票的原理,將兩個表格中相似程度最高的兩個名詞進行匹配。
示例數據如下圖:
代碼如下:
- 設置工作空間,加載數據
總結
- 上一篇: 电脑qq浏览器怎么滚动截长图_电脑上如何
- 下一篇: git clone 速度过慢