1.How Models work
Introduction
我們首先概述機器學習模型如何工作以及如何使用它們。如果您之前已完成統計建模或機器學習,這可能會感覺很基礎。別擔心,我們很快就會建立強大的模型。
本課程將為您構建以下場景的模型:
你的堂兄已經花了數百萬美元預測房地產。由于您對數據科學有興趣,他愿意與您成為業務合作伙伴。他會提供資金,你會提供預測各種房屋價值的模型。
你問你的堂兄他過去如何預測房地產價值。他說這只是直覺。但更多的質疑表明,他已經確定了他看過的房屋的價格模式,他利用這些模式對他正在考慮的新房進行預測。
機器學習的工作方式也是如此。我們將從一個名為決策樹的模型開始。有更高級的模型可以提供更準確的預測。但決策樹很容易理解,它們是數據科學中一些最佳模型的基本構建塊。
為簡單起見,我們將從最簡單的決策樹開始。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??
它將房屋分為兩類。 所考慮的任何房屋的預測價格是同一類別房屋的歷史平均價格。
我們使用數據來決定如何將房屋分成兩組,然后再確定每組的預測價格。 從數據捕獲模式的這一步稱為擬合或訓練模型。 用于擬合模型的數據稱為訓練數據。
模型如何合適的細節(例如,如何分割數據)非常復雜。 在模型適合后,您可以將其應用于新數據以預測其他房屋的價格。
Improving the Decision Tree
通過擬合房地產訓練數據,更有可能產生以下兩個決策樹中的哪一個?
左側的決策樹(決策樹1)可能更有意義,因為它捕捉到了這樣的現實:擁有更多臥室的房屋往往比臥室更少的房屋以更高的價格出售。 這種模式的最大缺點是它不能捕捉影響房價的大多數因素,如浴室數量,位置等。
您可以使用更多“拆分”的樹來捕獲更多因素。 這些被稱為“更深”的樹。 決策樹也考慮每個房子的總批量大小可能如下所示:
? ? ? ? ? ? ? ? ? ?
您可以通過在決策樹中進行追蹤來預測任何房屋的價格,并始終選擇與該房屋特征相對應的路徑。 房子的預測價格位于樹的底部。 我們進行預測的底部點稱為葉子。
葉子上的分割和值將由數據確定,因此您可以查看將要使用的數據。
Continue
讓我們更具體一點。 是時候檢查你的數據了。
總結
以上是生活随笔為你收集整理的1.How Models work的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: kazaalite.exe是什么进程 k
- 下一篇: 何小鹏:小鹏G9操控媲美保时捷卡宴、NV