【知识】人工智能数学基础知识
數(shù)學是打開科學大門的鑰匙。——培根
數(shù)學基礎知識蘊含著處理智能問題的基本思想與方法,也是理解復雜算法的必備要素。今天的種種人工智能技術歸根到底都建立在數(shù)學模型之上,要了解人工智能,首先要掌握必備的數(shù)學基礎知識,具體來說包括:
線性代數(shù):如何將研究對象形式化?
概率論:如何描述統(tǒng)計規(guī)律?
數(shù)理統(tǒng)計:如何以小見大?
最優(yōu)化理論: 如何找到最優(yōu)解?
信息論:如何定量度量不確定性?
形式邏輯:如何實現(xiàn)抽象推理?
01 線性代數(shù):如何將研究對象形式化
事實上,線性代數(shù)不僅僅是人工智能的基礎,更是現(xiàn)代數(shù)學和以現(xiàn)代數(shù)學作為主要分析方法的眾多學科的基礎。從量子力學到圖像處理都離不開向量和矩陣的使用。而在向量和矩陣背后,線性代數(shù)的核心意義在于提供了?種看待世界的抽象視角:萬事萬物都可以被抽象成某些特征的組合,并在由預置規(guī)則定義的框架之下以靜態(tài)和動態(tài)的方式加以觀察。
著重于抽象概念的解釋而非具體的數(shù)學公式來看,線性代數(shù)要點如下:線性代數(shù)的本質在于將具體事物抽象為數(shù)學對象,并描述其靜態(tài)和動態(tài)的特性;向量的實質是 n 維線性空間中的靜止點;線性變換描述了向量或者作為參考系的坐標系的變化,可以用矩陣表示;矩陣的特征值和特征向量描述了變化的速度與方向。
總之,線性代數(shù)之于人工智能如同加法之于高等數(shù)學,是一個基礎的工具集。
02 概率論:如何描述統(tǒng)計規(guī)律?
除了線性代數(shù)之外,概率論也是人工智能研究中必備的數(shù)學基礎。隨著連接主義學派的興起,概率統(tǒng)計已經(jīng)取代了數(shù)理邏輯,成為人工智能研究的主流工具。在數(shù)據(jù)爆炸式增長和計算力指數(shù)化增強的今天,概率論已經(jīng)在機器學習中扮演了核心角色。
同線性代數(shù)一樣,概率論也代表了一種看待世界的方式,其關注的焦點是無處不在的可能性。頻率學派認為先驗分布是固定的,模型參數(shù)要靠最大似然估計計算;貝葉斯學派認為先驗分布是隨機的,模型參數(shù)要靠后驗概率最大化計算;正態(tài)分布是最重要的一種隨機變量的分布。
03 數(shù)理統(tǒng)計:如何以小見大?
在人工智能的研究中,數(shù)理統(tǒng)計同樣不可或缺。基礎的統(tǒng)計理論有助于對機器學習的算法和數(shù)據(jù)挖掘的結果做出解釋,只有做出合理的解讀,數(shù)據(jù)的價值才能夠體現(xiàn)。數(shù)理統(tǒng)計根據(jù)觀察或實驗得到的數(shù)據(jù)來研究隨機現(xiàn)象,并對研究對象的客觀規(guī)律做出合理的估計和判斷。
雖然數(shù)理統(tǒng)計以概率論為理論基礎,但兩者之間存在方法上的本質區(qū)別。概率論作用的前提是隨機變量的分布已知,根據(jù)已知的分布來分析隨機變量的特征與規(guī)律;數(shù)理統(tǒng)計的研究對象則是未知分布的隨機變量,研究方法是對隨機變量進行獨立重復的觀察,根據(jù)得到的觀察結果對原始分布做出推斷。
用一句不嚴謹?shù)庇^的話講:數(shù)理統(tǒng)計可以看成是逆向的概率論。?數(shù)理統(tǒng)計的任務是根據(jù)可觀察的樣本反過來推斷總體的性質;推斷的工具是統(tǒng)計量,統(tǒng)計量是樣本的函數(shù),是個隨機變量;參數(shù)估計通過隨機抽取的樣本來估計總體分布的未知參數(shù),包括點估計和區(qū)間估計;假設檢驗通過隨機抽取的樣本來接受或拒絕關于總體的某個判斷,常用于估計機器學習模型的泛化錯誤率。
04 最優(yōu)化理論: 如何找到最優(yōu)解?
本質上講,人工智能的目標就是最優(yōu)化:在復雜環(huán)境與多體交互中做出最優(yōu)決策。幾乎所有的人工智能問題最后都會歸結為一個優(yōu)化問題的求解,因而最優(yōu)化理論同樣是人工智能必備的基礎知識。最優(yōu)化理論研究的問題是判定給定目標函數(shù)的最大值(最小值)是否存在,并找到令目標函數(shù)取到最大值 (最小值) 的數(shù)值。?如果把給定的目標函數(shù)看成一座山脈,最優(yōu)化的過程就是判斷頂峰的位置并找到到達頂峰路徑的過程。
通常情況下,最優(yōu)化問題是在無約束情況下求解給定目標函數(shù)的最小值;在線性搜索中,確定尋找最小值時的搜索方向需要使用目標函數(shù)的一階導數(shù)和二階導數(shù);置信域算法的思想是先確定搜索步長,再確定搜索方向;以人工神經(jīng)網(wǎng)絡為代表的啟發(fā)式算法是另外一類重要的優(yōu)化方法。
05 信息論:如何定量度量不確定性?
近年來的科學研究不斷證實,不確定性就是客觀世界的本質屬性。換句話說,上帝還真就擲骰子。不確定性的世界只能使用概率模型來描述,這促成了信息論的誕生。
信息論使用“信息熵”的概念,對單個信源的信息量和通信中傳遞信息的數(shù)量與效率等問題做出了解釋,并在世界的不確定性和信息的可測量性之間搭建起一座橋梁。
總之,信息論處理的是客觀世界中的不確定性;條件熵和信息增益是分類問題中的重要參數(shù);KL 散度用于描述兩個不同概率分布之間的差異;最大熵原理是分類問題匯總的常用準則。
06 形式邏輯:如何實現(xiàn)抽象推理?
1956 年召開的達特茅斯會議宣告了人工智能的誕生。在人工智能的襁褓期,各位奠基者們,包括約翰·麥卡錫、赫伯特·西蒙、馬文·閔斯基等未來的圖靈獎得主,他們的愿景是讓“具備抽象思考能力的程序解釋合成的物質如何能夠擁有人類的心智。”通俗地說,理想的人工智能應該具有抽象意義上的學習、推理與歸納能力,其通用性將遠遠強于解決國際象棋或是圍棋等具體問題的算法。
如果將認知過程定義為對符號的邏輯運算,人工智能的基礎就是形式邏輯;謂詞邏輯是知識表示的主要方法;基于謂詞邏輯系統(tǒng)可以實現(xiàn)具有自動推理能力的人工智能;不完備性定理向“認知的本質是計算”這一人工智能的基本理念提出挑戰(zhàn)。
來源:數(shù)據(jù)科學與人工智能
精彩活動
福利 · 閱讀 | 免費申請讀大數(shù)據(jù)新書 第23期
推薦閱讀
2017年數(shù)據(jù)可視化的七大趨勢!?
全球100款大數(shù)據(jù)工具匯總(前50款)?
論大數(shù)據(jù)的十大局限
大數(shù)據(jù)時代的10個重大變革
大數(shù)據(jù)七大趨勢 第一個趨勢是物聯(lián)網(wǎng)
Q:?你認為了解人工智能還需要哪些基礎?
歡迎留言與大家分享
請把這篇文章分享給你的朋友
轉載 / 投稿請聯(lián)系:hzzy@hzbook.com
更多精彩文章,請在公眾號后臺點擊“歷史文章”查看
總結
以上是生活随笔為你收集整理的【知识】人工智能数学基础知识的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: STM32之RCC配置
- 下一篇: S5PV210裸机之外部中断