python北京房价预测_python数据分析——北京房价分析
數(shù)據(jù)集及源代碼鏈接:https://github.com/roberpan/python/tree/master/test/dataanalyse/houseprice
一、統(tǒng)計北京各區(qū)二手房單價排名,并分析高端小區(qū)(排名前10/50/100的小區(qū)),各區(qū)占有量
# -*- coding: utf-8 -*-
# 根據(jù)安居客數(shù)據(jù)來源,對二手房信息進行統(tǒng)計
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('data/anjuke.csv')
get_region = lambda x: x.split('-')[0]
address = data['Region'].apply(get_region)
data['District'] = address
data['Unit_price'] = data['Price'] / data['Size']
plt.figure(figsize=(12,8)) #設置畫布大小
grid=plt.GridSpec(2,3) #劃分畫布,這樣可以調節(jié)每個子圖的大小
#繪制北京各行政區(qū)房價排名
fig1=plt.subplot(grid[0,0:3])
datagroup1 = data.groupby(['District'], as_index=False)
unit_price_mean=datagroup1.Unit_price.mean().sort_values(by='Unit_price',ascending=False)
sns.barplot(x='District',y='Unit_price',data=unit_price_mean)
plt.suptitle('北京各行政區(qū)房價排名')
#繪制總價排前列小區(qū)中,各個行政區(qū)的擁有量
datagroup2 = data.groupby(['District','Garden'], as_index=False)
price_mean = datagroup2.Price.mean()
price_mean = price_mean.sort_values(by='Price', ascending=False)
max_data1 = price_mean[:10]
max_data2 = price_mean[:50]
max_data3 = price_mean[:100]
sns.set()
fig2=plt.subplot(grid[1,0])
sns.countplot(x='District', data=max_data1).set_title('總價排名前10小區(qū)各行政區(qū)占有量')
fig3=plt.subplot(grid[1,1])
sns.countplot(x='District', data=max_data2).set_title('總價排名前50小區(qū)各行政區(qū)占有量')
fig4=plt.subplot(grid[1,2])
sns.countplot(x='District', data=max_data3).set_title('總價排名前100小區(qū)各行政區(qū)占有量')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()
以上執(zhí)行結果如下圖所示:
從以上結果可以看出:
1、從二手房單價維度看:西城最高,東城和海淀分別列第二、第三名,最低的區(qū)縣是平谷
2、從二手房總價排名前列的小區(qū)看:朝陽區(qū)遙遙領先,海淀、西城、順義也排名較為靠前
以上結果可以說明:
1、西城、東城、海淀單價高,應該與此三個區(qū)學區(qū)較好、較多有關,與地理位置也有一定關系,但學區(qū)影響應該遠大于地理位置影響,因為朝陽區(qū)、豐臺區(qū)位置都靠近市中心,但價格不明顯
2、朝陽區(qū)應該是富人最多的區(qū)域,再加上地理位置加成,其豪宅小區(qū)基本上占整個北京豪宅小區(qū)的一半以上,這也與朝陽區(qū)商業(yè)發(fā)達高度相關。另外比較意外的有兩個:一個是順義區(qū)豪宅小區(qū)也較多,應該與其擁有多個別墅小區(qū)、以及靠近朝陽區(qū)有關系;二是東城區(qū)豪宅數(shù)量很少(前100名豪宅小區(qū)數(shù)還不如昌平,跟大興差不多),應該與東城小區(qū)老舊,單個二手房面積小有關系
二、顯示北京二手房單價排名前十小區(qū)
# -*- coding: utf-8 -*-
# 根據(jù)安居客數(shù)據(jù)來源,對二手房信息進行統(tǒng)計
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
data = pd.read_csv('data/anjuke.csv')
get_region = lambda x: x.split('-')[0]
address = data['Region'].apply(get_region)
data['District'] = address
data['Unit_price'] = data['Price'] / data['Size']
gardengp=data.groupby('Garden',as_index=False)
gardenmean=gardengp.Unit_price.mean().sort_values(by='Unit_price',ascending=False)
sns.barplot(x='Garden',y='Unit_price',data=gardenmean[:10],palette='Spectral_r')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()
顯示結果如下:
總結
以上是生活随笔為你收集整理的python北京房价预测_python数据分析——北京房价分析的全部內容,希望文章能夠幫你解決所遇到的問題。