Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略
生活随笔
收集整理的這篇文章主要介紹了
Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Dataset之Boston:Boston波士頓房價數據集的簡介、下載、使用方法之詳細攻略
?
?
?
?
目錄
Boston波士頓房價數據集的簡介
Boston波士頓房價數據集的下載
Boston波士頓房價數據集的使用方法
?
?
?
?
?
Boston波士頓房價數據集的簡介
? ? 該數據集包含美國人口普查局收集的美國馬薩諸塞州波士頓住房價格的有關信息, 數據集很小,只有506個案例。
數據集都有以下14個屬性:
- CRIM--城鎮人均犯罪率? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ------【城鎮人均犯罪率】
- ZN - 占地面積超過25,000平方英尺的住宅用地比例。? ? ? ? ? ? ? ?------【住宅用地所占比例】
- INDUS - 每個城鎮非零售業務的比例。 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?? ------【城鎮中非商業用地占比例】
- CHAS - Charles River虛擬變量(如果是河道,則為1;否則為0 ?------【查爾斯河虛擬變量,用于回歸分析】
- NOX - 一氧化氮濃度(每千萬份) ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ------【環保指標】
- RM - 每間住宅的平均房間數 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?------【每棟住宅房間數】
- AGE - 1940年以前建造的自住單位比例 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ------【1940年以前建造的自住單位比例 】
- DIS -波士頓的五個就業中心加權距離 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?------【與波士頓的五個就業中心加權距離】
- RAD - 徑向高速公路的可達性指數 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ------【距離高速公路的便利指數】
- TAX - 每10,000美元的全額物業稅率 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?------【每一萬美元的不動產稅率】
- PTRATIO - 城鎮的學生與教師比例? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?------【城鎮中教師學生比例】
- B - 1000(Bk - 0.63)^ 2其中Bk是城鎮黑人的比例? ? ? ? ? ? ? ? ? ?------【城鎮中黑人比例】
- LSTAT - 人口狀況下降% ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?------【房東屬于低等收入階層比例】
- MEDV - 自有住房的中位數報價, 單位1000美元 ? ? ? ? ? ? ? ? ? ? ?? ?------【自住房屋房價中位數】
?
Boston波士頓房價數據集的下載
下載地址:https://archive.ics.uci.edu/ml/machine-learning-databases/housing/housing.data
from sklearn.datasets import load_bostonboston = load_boston() print(boston.DESCR) Boston House Prices dataset ===========================Notes ------ Data Set Characteristics: :Number of Instances: 506 :Number of Attributes: 13 numeric/categorical predictive:Median Value (attribute 14) is usually the target:Attribute Information (in order):- CRIM per capita crime rate by town- ZN proportion of residential land zoned for lots over 25,000 sq.ft.- INDUS proportion of non-retail business acres per town- CHAS Charles River dummy variable (= 1 if tract bounds river; 0 otherwise)- NOX nitric oxides concentration (parts per 10 million)- RM average number of rooms per dwelling- AGE proportion of owner-occupied units built prior to 1940- DIS weighted distances to five Boston employment centres- RAD index of accessibility to radial highways- TAX full-value property-tax rate per $10,000- PTRATIO pupil-teacher ratio by town- B 1000(Bk - 0.63)^2 where Bk is the proportion of blacks by town- LSTAT % lower status of the population- MEDV Median value of owner-occupied homes in $1000's:Missing Attribute Values: None:Creator: Harrison, D. and Rubinfeld, D.L. This dataset was taken from the StatLib library which is maintained at Carnegie Mellon University. The Boston house-price data of Harrison, D. and Rubinfeld, D.L. 'Hedonic prices and the demand for clean air', J. Environ. Economics & Management, vol.5, 81-102, 1978. Used in Belsley, Kuh & Welsch, 'Regression diagnostics ...', Wiley, 1980. N.B. Various transformations are used in the table on pages 244-261 of the latter. The Boston house-price data has been used in many machine learning papers that address regression problems. **References**- Belsley, Kuh & Welsch, 'Regression diagnostics: Identifying Influential Data and Sources of Collinearity', Wiley, 1980. 244-261.- Quinlan,R. (1993). Combining Instance-Based and Model-Based Learning. In Proceedings on the Tenth International Conference of Machine Learning, 236-243, University of Massachusetts, Amherst. Morgan Kaufmann.- many more! (see http://archive.ics.uci.edu/ml/datasets/Housing)?
Boston波士頓房價數據集的使用方法
1、更多詳見本博客算法案例
X = boston.data y = boston.target?
?
?
?
總結
以上是生活随笔為你收集整理的Dataset之Boston:Boston波士顿房价数据集的简介、下载、使用方法之详细攻略的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 成功解决AttributeError:
- 下一篇: ML之NBLoR:利用NB(朴素贝叶斯)