朴素贝叶斯python实现预测_Python朴素贝叶斯预测.PDF
Python樸素貝葉斯預測
Python樸素貝葉斯 1
大綱
? 樸素貝葉斯預測原理及其算法應用場景
? Python貝葉斯實現
? Python機器學習應用
Python樸素貝葉斯 2
機器學習和大數據
? 機器學習算法已經廣泛應用于大數據處理領域
? 在具體處理大數據任務時,隨著機器學習社區的發展和實踐驗證,機
器學習的算法應用獲得了更多社區力量的支持、改進和推廣
? 以最廣泛的分類算法為例,大致可以分為線性和非線性兩大方向。
Python樸素貝葉斯 3
機器學習
? 線性算法有著名的邏輯回歸、樸素貝葉斯、最大熵等
? 線性算法的優點是訓練和預測的效率比較高,但最終效果對特征的
依賴程度較高,需要數據在特征層面上是線性可分的。
? 因此,使用線性算法需要在特征工程上下不少功夫,盡量對特征進
行選擇、變換或者組合等使得特征具有區分性。
? 非線性算法有隨機森林、決策樹、神經網絡、核機器等。
? 非線性算法的優勢是可以建模復雜的分類面,從而更好的擬合數據。
Python樸素貝葉斯 4
Python scikit-learn機器學習算法庫
? 目前使用Python寫機器學習算法比較多
? 為了不從造輪子開始,在項目應用中,Python提供了Scikit-learn這個
機器學習算法庫,屬于本領域最好的算法庫之一
? Python 這個庫優點很多:簡單易用,接口抽象得非常好,不僅僅
是結構化的數值數據,文本文檔處理的支持也很好
Python樸素貝葉斯 5
樸素貝葉斯的應用場景
? 樸素貝葉斯是一種用于分類問題的機器學習算法。
? 可用于涉及高維訓練數據集的文本分類。
? 分類問題是監督學習問題的示例。它有助于從一組類別中識別新觀
察的類別(子群體)。該類別是基于包含其類別成員已經已知的觀
察(或實例)的數據的訓練集合來確定的。
? 幾個相關的例子有:垃圾郵件過濾、情感分析和新聞文章分類。
? 樸素貝葉斯因簡單、有效性而聞名。
? 它能快速構建模型和使用樸素貝葉斯算法進行預測。
? 樸素貝葉斯是用于解決文本分類問題的有效算法。
Python樸素貝葉斯 6
樸素貝葉斯的“樸素”
? 樸素貝葉斯算法是學習具有屬于特定組/類的某些特征的對象的概率
的算法。簡而言之,它是一個概率分類器。
? 樸素貝葉斯算法被稱為 “樸素”是因為它假設某個特征的出現與其它
特征的出現是獨立的
? 例如,如果你試圖根據其顏色,形狀和味道識別水果,那么橙色的、
球形的和味道濃烈的水果很可能是橘子。
? 即使這些特征依賴于彼此或取決于其他特征的存在,所有這些特性
可以單獨地促成該果實是橙色的可能性,這就是為什么它被稱為
“樸素的”。
Python樸素貝葉斯 7
樸素貝葉斯理論
? 樸素貝葉斯算法是一個典型的統計學習方法,主要理論基礎就是一個
貝葉斯公式,貝葉斯公式的基本定義如下:
? 這個公式它卻能總結歷史,預知未來。
? 公式的右邊是總結歷史,公式的左邊是預知未來
? 如果把Y作為類別,X表示特征,P(Yk|X)就是在已知特征X的情況下
求Yk類別的概率,而P(Yk|X)的計算又轉化到類別Yk的特征分布上來
Python樸素貝葉斯 8
樸素貝葉斯算法的貝葉斯定理
? 在機器學習的分類問題,有多種特征和類,比如C1 ,C2 ,……,Ck ,
樸素貝葉斯算法的主要目的是計算具有特征向量X1 ,X2 ,……,Xn ,
屬于特定類Ci的事
總結
以上是生活随笔為你收集整理的朴素贝叶斯python实现预测_Python朴素贝叶斯预测.PDF的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: turbo码java实现_Turbo码的
- 下一篇: 【学生考勤管理系统】 学生考勤打卡系统