python分析北京租房现状,最后的价格分布地图亮了
租房信息已經有了,為了能對北京目前的租房市場有個直觀認識,我對數據進行深度分析,并進行可視化展示
從分析結果中,我得到了哪些位置房源多、各區租房平均價格以及心儀價格地理位置分布等重要信息,為幫助我租房提供重要依據
下面帶大家一起看一下整個分析過程:
很多人學習python,不知道從何學起。
很多人學習python,掌握了基本語法過后,不知道在哪里尋找案例上手。
很多已經做案例的人,卻不知道如何去學習更加高深的知識。
那么針對這三類人,我給大家提供一個好的學習平臺,免費領取視頻教程,電子書籍,以及課程的源代碼!
QQ群:1156465813
1.分析各行政區房源數量及單價
import pandas as pd beijing_daname=['朝陽區', '豐臺區', '海淀區', '大興區', '通州區', '昌平區', '東城區', '西城區', '順義區'] data=pd.read_csv('租房數據加經緯度.csv',encoding='gbk') areas=list(set(list(data['行政區']))) area_sums={} for area in areas:area_sums[area]=list(data['行政區']).count(area) from pyecharts import options as opts from pyecharts.charts import Bar import random hotel_num=[area_sums[i] for i in beijing_daname] bar = (Bar().add_xaxis(beijing_daname).add_yaxis("", hotel_num).set_global_opts(title_opts=opts.TitleOpts(title="北京各區房源數量")).set_series_opts(label_opts=opts.LabelOpts(is_show=True),markline_opts=opts.MarkLineOpts(data=[opts.MarkLineItem(type_="min", name="最小值"),opts.MarkLineItem(type_="max", name="最大值"),opts.MarkLineItem(type_="average", name="平均值"),]),) ) bar.render_notebook()從上圖可以得出以下結論:
朝陽區的房源數量最多,有1877套順義區的房源數量最少,有272套9個區平均房源數量為611套。各城區房源單價情況(每平米單價*30平米為例)
?
unit_price={} for i in list(data.groupby('行政區')):if i[0] in beijing_daname:unit_price[i[0]]=int(i[1]['價格'].sum()/i[1]['面積'].sum())*30 unit_price bar = (Bar().add_xaxis(list(unit_price.keys())).add_yaxis("", [unit_price[i] for i in list(unit_price.keys())]).set_global_opts(title_opts=opts.TitleOpts(title="北京各區租房均價(每平米單價*30平米為例)")).set_series_opts(label_opts=opts.LabelOpts(is_show=True),markline_opts=opts.MarkLineOpts(data=[opts.MarkLineItem(type_="min", name="最小值"),opts.MarkLineItem(type_="max", name="最大值"),opts.MarkLineItem(type_="average", name="平均值"),]),) ) bar.render_notebook()?
以30平米為例:???????
西城區的住房價格最高,為4350元通州區的租房價格最低,為1620元價格差距還是很大的。2.分析分析各戶型占比及價格分布
layouts=list(set(data['戶型'])) layout=data.loc[:,'戶型'].value_counts() from pyecharts import options as opts from pyecharts.charts import Pie print(list(layout.index)[:10]) values=[int(i) for i in list(layout.values)[:10]] pie = (Pie().add("",[(i,j)for i,j in zip(list(layout.index)[:10],values)],radius=["30%", "75%"],center=["40%", "50%"],rosetype="radius",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="北京市各區出租房戶型占比"),legend_opts=opts.LegendOpts(type_="scroll", pos_left="85%", orient="vertical"),).set_series_opts(label_opts=opts.LabelOpts(formatter=": {c},ze8trgl8bvbq%")) ) pie.render_notebook()由于戶型種類比較多,所以我只選了前10種,從圖中可以看出,房源主流是1室1廳1衛,占比41.86%,其次分別是是2室1廳1衛、1室0廳1衛,各占比30.58%和11.02%
cut_n=list(range(0,12000,1000)) income=pd.cut(data["價格"],cut_n) price_cut=data['價格'].groupby(income).count() index=list(price_cut.index) index=[str(i) for i in list(price_cut.index)] values=[int(i) for i in list(price_cut.values)] pie = (Pie().add("",[(i,j)for i,j in zip(index,values)],radius=["30%", "75%"],center=["40%", "50%"],rosetype="radius",label_opts=opts.LabelOpts(is_show=False),).set_global_opts(title_opts=opts.TitleOpts(title="北京市各區出租房戶型占比"),legend_opts=opts.LegendOpts(type_="scroll", pos_left="85%", orient="vertical"),).set_series_opts(label_opts=opts.LabelOpts(formatter=": {c}, ze8trgl8bvbq%")) ) pie.render_notebook()?
?
目前,主流的租房價格在3000至6000元,占比50%左右,最便宜有1000元以下的,位置相對較偏,且面積在20平以內;貴的有1萬多的,這種一般面積在100平以上,位置在主城區。
3.房子位置分布
根據上述分析情況和我的預算,我決定在朝陽區找一套合適的房子,取出價格在4000至6000元的數據,另存表格,并將表格導入水經注地圖下載器中
com_data=data[data['價格'].le(6000)] com_data=com_data[com_data['價格'].ge(3000)] com_data=com_data[com_data['行政區']=='朝陽區'] com_data.to_csv('心儀房子.csv',encoding='gbk')結果展示如下:
下面紅色數字為租房價格,這樣找起房子來就更方便了
在這里還是要推薦下我自己建的Python開發學習群:1156465813,群里都是學Python開發的,如果你正在學習Python ,歡迎你加入,大家都是軟件開發黨,不定期分享干貨(只有Python軟件開發相關的),包括我自己整理的一份2020最新的Python進階資料和高級開發教程,歡迎進階中和進想深入Python的小伙伴!
?
總結
以上是生活随笔為你收集整理的python分析北京租房现状,最后的价格分布地图亮了的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数学建模方法总结(matlab)
- 下一篇: 北京租房工具