概率主题模型简介 Introduction to Probabilistic Topic Models
生活随笔
收集整理的這篇文章主要介紹了
概率主题模型简介 Introduction to Probabilistic Topic Models
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
摘要:概率主題模型是一系列旨在發現隱藏在大規模文檔中的主題結構的算法。本文首先回顧了這一領域的主要思想,接著調研了當前的研究水平,最后展望某些有所希望的方向。從最簡單的主題模型——潛在狄立克雷分配(Latent Dirichlet Allocation,LDA)出發,討論了其與概率建模的聯系,描述了用于主題發現的兩種算法。主題模型日新月異,被擴展和應用許多領域,其中不乏有趣之處。我們調研發現很多擴展都弱化了LDA的統計假設,加入元數據(meta-data)進行文檔分析,使用近似的模型分析如社會網絡、圖像和基因這類多樣化的數據類型。我們在文章的最后給出了主題模型目前還未探索但很重要的方向,包括嚴格檢驗數據模型的方法,文本和其它高維數據可視化的新技術,以及如何從傳統信息工程中的應用推廣到更多科學應用。
1 引言
如今公開的知識日益以新聞、博客、網頁、科學論文、書籍、圖像、聲音、視頻和社交網絡的形式被數字化存儲,巨大的信息量同時也增加了人們尋找和發
總結
以上是生活随笔為你收集整理的概率主题模型简介 Introduction to Probabilistic Topic Models的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 遗传算法与直接搜索工具箱学习笔记 ---
- 下一篇: 如何用Python写一个贪吃蛇AI