如何利用数据分析买到好房子?
買房是一件人生大事,我們作為一名數據分析師,如何運用數據分析的知識買到心儀的房子呢?
正文
最近樓市好像又行了,各地都傳出房地產調控政策松動的消息。我這個互聯網數據分析號主也想來聊一聊樓市了。
杭州樓市在過去的半年分化越來越明顯。三四年前同樣起點的小區目前拉開30%~40%的差價都很正常。
很多人就開始后悔:為什么當時買的是a小區而不是b小區,買錯了房少賺了幾百萬。
有這樣想法的人,其實你讓他真的回到幾年前買了B小區,他還是會后悔。因為他會后悔為什么當時買的是b小區,而不是買比特幣。
買房是一件人生大事,選錯房對人生影響太大了。所以這篇文章就聊一聊”如何通過數據分析買到好房子“。
用數據選房
我作為一個同樣在幾年前在杭州買房的人,我從來不后悔當時選擇的方案。因為我知道,即使讓我重新回到三年前,通過我當時所有能夠掌握的信息,我也做不出比目前更好的選擇。
差別在哪里呢?
身邊有人的買房經歷是這樣的:
從親戚朋友/電梯廣告/路邊海報/信息流廣告等處得知某樓盤即將開盤,多方打聽以后發現性價比很好,在銷售的多次電話催促后通知房源告罄時匆忙下單。
還有這樣的:每個周末都讓中介領著自己看幾套房,兩個月下來看了二十幾套,各有優劣。老婆喜歡a小區的環境,老人覺得b小區離醫院學校近,自己覺得c小區上班方便。
最終要么選一個折中方案,折中就代表著大家都接受但其實都不滿意。
要么最后拍腦袋選一個,最后選錯就不停抱怨。
這兩種方法都有問題,前一種信息不全,后一種決策過程不清晰。
如果用數據分析的方法做決策,會收集大量信息,并根據信息得出理性的結論。只要得到的信息是相同的,每次做的決定應該是一樣的。
具體怎么做呢?
數據分析,那肯定得要有數據呀。
我們可以寫一段爬蟲從某殼網上爬取附近小區的房價數據,然后用地圖做一個炫酷的xx市房價熱力圖,高級一點的話點開小區還有小區的房價走勢。做出類似下圖的樣式:
(圖片來自網絡)
你看,數據分析師短短幾個小時的時間就比普通買房者多獲得了幾個數量級的信息量。數據分析師獲取信息的能力就是這么夸張。
足不出戶,就能知天下事。是不是很高級。
接下來我就來教如何用爬蟲實現這一切。
真正的分析思維
爬蟲呢,就是……
教個P,其實我根本就不會爬蟲,編不下去了。
重要的是:用爬蟲獲取房價數據能解決選房買房的問題嗎?
以下問題考慮過沒有:
價格洼地就一定好嗎?
便宜的房子是不是有什么問題?
并且你以為網站上的價格是真實價格嗎?
房子周邊沒有學區,以后小孩讀書怎么辦?
這些問題都沒有考慮,買什么房?
爬取房價數據和地理分布,最多只是輔助我們做最終決策的一個方式,而不是主要的分析方法。要得出最終的結論,還是要把數據分析的思維貫穿其中。
數據分析的思維解決問題一般有這樣幾個步驟:
明確問題
收集信息
分析數據
得出結論
明確問題
你買房到底是為了啥?是為了結婚?還是為了投資?亦或者第二套改善房?搞不清楚需求,就沒法衡量不同房子之間的優缺點。
沒有房子是完美的。有的房子配套齊全,但是房齡老,戶型差。還有的房子戶型環境配套等都很好,但是貴!
而且人的喜好也是不同的。就算同樣是市中心的房子,喜歡熱鬧的人喜歡,喜歡自然風光的人不喜歡。還有人喜歡住高樓層,有人喜歡住低樓層。
買房第一步,搞清買房的目的,究竟要什么樣的房子,要解決那些功能性需求以及有哪些偏好。
收集信息
之前用爬蟲爬取房價數據也是信息收集的一種,但是房子除了價格之外,還有很多其他指標。比如戶型、采光、交通、教育等等。
沒必要把所有指標都收集全了之后再做決策,有些指標有些是有一票否決權的,可以先收集這些指標,縮小最后選擇的范圍。
價格信息
第一步先收集價格信息。價格信息不僅容易收集,也存在硬性約束。一般買房會有一個預算區間,太好太差的都不會考慮。這一步可以排除掉大部分小區。
周邊現有配套
周邊配套信息和價格信息一樣,也是相對容易獲取的,可以足不出戶在電腦或手機上完成。通過百度地圖查一下醫院、學校、商場等信息,可以把一些配套明顯不行的排除掉。
其中學區的判定不能直接通過距離判斷,學區一般是通過戶籍所屬的社區決定的??梢运阉鲗W校的招生簡章,會標明招生范圍是某街道某社區的。
社區的范圍是一個比較麻煩的東西,地圖一般只顯示到某某街道,不會細到某某社區。搜索某街道某社區的話只會到某一個點。
這里我推薦一個我自己發現的地圖網站openstreet。在地圖上會顯示社區名,不過社區范圍不太精確。但是街道卻非常清楚,甚至在地圖上可以看到街道的分解線。
這里能采集到的大部分是現有的配套(openstreet會顯示一些規劃中的道路),有些配套還在規劃中,這些就只能具體情況具體分析。
周邊規劃
周邊規劃的獲取渠道有這么幾種。
入門版 道聽途說
這是最常見的類型,最初我也在這個階段停留了很久。
一般是咨詢當地朋友,了解一些規劃。對于一些較成熟的城市來說這樣也許足夠了,成熟城市大的規劃較少,但杭州城西的規劃層出不窮,普通人還真未必搞得清楚。
就比如一般人會關心學校醫院等正向的規劃,忽略高架高壓線等負向規劃。如果門口道路要改造成高架,噪音影響還是很大的。
進階版 房產類公眾號
稍微好點的方式,是關注幾個房產公眾號。在炒房成風的杭州,這類公眾號多如牛毛,搜幾個熱門樓盤的名字就很如找到。
這類公眾號一般對規劃很敏感,一有風吹草動就會開一篇文章解讀。這類消息源相比朋友之間的口口相傳信息密度大得多,消息源也更可靠一些。
高階版 政府網站
最高階的玩法是直接從規劃的源頭入手,直接在政府網站看規劃文件。
這樣做的優點是內容一般比較全面和準確,缺點是規劃文件真的太難找了,整理起來也比較費勁。
規劃有好幾個不同級別,有國家級,省級,市級,區級。像地鐵規劃就要gwy的批準,省級的則有一些《xx省xx發展規劃綱要》,市區級是一些市政設施如學校醫院道路交通的規劃,以及土地出讓信息。
這里面國家級和省級的規劃一般是很少變化的,通過之前朋友打聽和房產公眾號也基本能了解。
變化比較多的是市區級的規劃。
很多道聽途說的規劃可能只是吹吹風,根本沒有規劃文件?;蛘咧暗哪硞€規劃已經改了,而大家還不知道。所以市區級規劃最佳信息源還是第一手的市級區級政府網站。
不同地區政府部門的排版差異還是挺大的,一般的目錄是
政務公開-規劃計劃-規劃信息-空間規劃
這里面會有大量土地出讓信息和規劃文件。如下圖:
小區配套
搞定了周邊配套好規劃,接下來具體的小區信息,就需要實地考察了。
不過在實地考察前,還是有一些方便的方式做好提前排雷。
1,貝殼找房的實地視頻
貝殼找房對各個小區的物業環境拍攝了視頻,可以不用到小區就有第一手的視頻資料。
2,百度街景
百度街景是百度地圖的一項功能,如果你對房子周邊的環境不是特別熟悉的話,可以用百度街景先把附近的道路和街景搞清楚。比如我之前關注過一段時間的佛山樓市,雖然我佛山一次都沒去過,但是通過百度街景,我對佛山主要街道已經很熟悉了。
以上都完成之后,開始進入實地考察階段。
實地考察
實地考察時,除了關注室內的戶型和采光,也要多多關注小區的情況。主要考察這幾個方面。
小區環境
小區配套設施
物業管理水平
交通擁堵情況
停車位
鄰里畫像
主觀偏好
這些小區信息對二手房來說比較容易確定,所見即所得。新房的話,只能多看看沙盤和圖紙了。新房交付減配的情況時有發生,需要一定的運氣。認準大開發商會相對更保險。
實地看房至少要看10套不同戶型,看三五套的時候沒啥感覺,不容易給出客觀的評價??吹?0套的時候基本上心里就有數了。
分析數據
說了這么多信息獲取的方式,還有一個最大的問題沒有解決。
以上的信息都很主觀,A小區和B小區究竟哪個環境更好,沒有絕對標準,如何量化比較?
兜了這么大一個圈子,終于到了具體的數據分析環節了。
我用的方法是層次分析法。
層次分析法
層次分析法,簡稱AHP,是指將與決策總是有關的元素分解成目標、準則、方案等層次,在此基礎之上進行定性和定量分析的決策方法。
上面這段話很學術,沒錯,是我從網上復制來的。要想說清概念比較麻煩,不如直接來看案例。
層次分析法適用于多目標決策問題,什么是多目標呢。買房就是一個多目標的決策問題,價格、交通、教育、醫療等都需要考慮,其中許多目標還是矛盾的。層次分析法就是在這多個不同目標中選擇一個最佳的方案。
層次結構
構建層次分析法首先要建立層次結構,結構有三層:
目標層
準則層
方案層
不解釋,上案例。
買房的決策就如上圖所示,一共有n套房子需要比較,每一套都參考準則層的m個準則評估,最后得到一個目標層的總分,得分最高者就是最佳選項。得分的計算公式是維度權重*維度得分,即:
房子A的目標分=房子A的價格得分*價格權重+房子A的交通得分*交通權重+房子A的商業得分*商業權重……以此類推。
公式里會出現兩個數字:
方案在不同準則內的得分
各準則的權重
知道了這兩個數字,總得分的計算就非常簡單了。
準則權重
先說說如何算準則的權重。
第一種,直接拍腦袋。
沒錯,就是拍腦袋。我們結合自己對需求的理解,直接對準則層中交通、醫療、教育、商業等等不同的維度賦予一個分數。如果只有四個維度的話,可以這樣:
交通0.2,醫療0.3,教育0.3,商業0.2。
或者
交通0.1,醫療0.3,教育0.4,商業0.2
分數根據自己感覺去打,只要最終分數加起來等于1就行
第二種,間接拍腦袋。
沒錯,還是拍腦袋,只不過比直接拍要高級一點,做法是專家打分和對比矩陣。
對比矩陣長這樣:
表??格中的分數代表著兩兩比較的關系,分數從1-9代表不同含義:
1代表兩個因素同等重要
3代表一個因素比另一個因素稍微重要
5代表一個因素比另一個因素明顯重要
7代表一個因素比另一個因素強烈重要
9代表一個因素比另一個因素極端重要
2,4,,6,8是上述數據的中值
倒數,A和B相比如果是3,那么B和A相比就是1/3
看起來是不是很精準?
那分數怎么來的呢?答案還是拍腦袋——啊不,是專家打分。
這里的專家就是你自己和家人朋友,當日最主要的還是房子的所有人和使用者。
上面表格中的數字,還不能直接計算出權重,還需要做一下一致性檢驗。
為啥要做這一步呢?
舉個例子:如果你覺得醫療相比教育來說明顯重要,打了5分;而醫療相比商業強烈重要,打了7分,那么教育和醫療就一定不是同等重要的,如果你打了1分就是不合理的。
一致性檢驗就是幫你檢查在打分過程中是否存在標準不統一的情況,具體做法這里不贅述了。
通過了一致性檢驗,可以對上述表格計算出權重,最終得出權重如下:
交通0.1017、醫療0.2636、教育0.5189、商業0.1157。
計算方法這里不展開了。
準則打分
準則的權重確定后,我們還要給各個方案的不同準則打分。
打分的方式和權重的確認類似,基本也是拍腦袋。不過我們之前收集信息的時候已經有了一些記錄,根據這些記錄打分也算有一些根據,不是胡亂拍腦袋。
舉個例子,我們通過實地調查,得到了下面的表格。
最簡單的辦法就是把這些主觀描述直接轉化成分數,按照十分制或者百分制都行,只要保持統一即可。
稍微復雜點的話就和之前算權重的方法一樣,只不過要多做幾遍。
比如交通方面,我們對比一下ABC三套房子。
之前分數越高代表越重要,現在打分的時候分數越高代表該項準則下表現越好。
然后再對上表進行一致性檢驗,以及計算結果,得出該準則下的分值。
其他的準則同理。
得出結論
算出了準則的權重和不同方案的得分,最后計算出總得分即可。如下圖所示(數據只是演示,和之前的表格無關):
房子編號 | 交通 權重0.1 | 醫療 權重0.26 | 教育 權重0.52 | 商業 權重0.12 | 總得分 |
房子A | 0.2 | 0.35 | 0.4 | 0.1 | 0.331 |
房子B | 0.25 | 0.3 | 0.28 | 0.15 | 0.2666 |
房子C | 0.3 | 0.4 | 0.15 | 0.1 | 0.224 |
最后計算得出房子A的分數最高,所以選房子A。
不過因為之前打分的時候很多時候是拍腦袋的,帶有一點主觀成分,會有一定的偏差,如果最終前幾名得分比較接近的話,可以選出前三或前五,最終選擇其中一個。
18年末,我用上述這套方法選出的top2小區,在之后的兩年都是周邊地區漲幅top5。又因為當時收集了大量規劃信息,我一度被同事們公認為買房達人。
總結
今天聊了聊數據分析思維在買房這件事當中的應用。數據分析師分析一個問題,絕不是一上來就看有什么數據,而是要遵循分析的基本方法,從明確問題開始一步步深入,隨后挖掘更多信息,并通過科學的數學方法得出客觀有效的結論。
這篇文章還提供了很多別人不知道的工具和技巧,希望這篇文章能幫你在大城市更好地扎下根。
對比Excel系列圖書累積銷量達15w冊,讓你輕松掌握數據分析技能,感興趣的同學可以直接在各大電商平臺搜索書名了解:
總結
以上是生活随笔為你收集整理的如何利用数据分析买到好房子?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 10分钟学会用Python轻松玩转Exc
- 下一篇: 深圳一男子举牌相亲 月薪6千要求女方1万