pyecharts geo_pyechartstableau可视化分析案例+分析思路
大家好,今天的視頻是關于廣州市的美食數(shù)據(jù)可視化分析,對美食的整體分布情況做了一個展示,加上一些美食推薦。我們從四個角度展示我們的數(shù)據(jù),地理位置,商圈,得分,美食推薦。文章的重點在于(二)部分,該怎么講好一個可視化的故事,同時該如何分析圖中的insight。
(一)數(shù)據(jù)清洗
拿到的數(shù)據(jù)是兩個主表和地理位置表
經(jīng)過簡單清洗后的數(shù)據(jù)如下所示:
清洗的過程主要包含表格合并,創(chuàng)建一些新字段,簡單對文本進行手工清洗。
(二)可視化思路
首先是我們想講一個怎么樣的故事,在pre的過程中,你的核心故事線是什么,不要為了展示而展示,這個決定了你的展示的核心。
我簡單提一個思路,作為城市展示宣傳中的美食宣傳(就是一個整體),消費者進餐指南,或者更有高端的從中分析美食行業(yè)進入的咨詢報告(更像一份商業(yè)報告)。我水平有限,就做最簡單的第一個,或者說有一點第一個和第二個的雜糅hhh。
原始的字段有這些“名稱 評論數(shù) 人均價格 菜系 商圈 地址 推薦1 推薦2 推薦3 口味評分 環(huán)境評分 服務評分 星級 店鋪ID 公共交通 緯度 經(jīng)度 行政區(qū)名稱”。
- 地理位置
由于地理位置最直觀,能夠給客戶(觀眾)留下印象,首先是地理位置展示,從這個角度,我們最容易想到是店鋪數(shù)量在不同區(qū)域存在不同的分布,在這里我們給出了一個行政區(qū)的劃分,所以很容易做出了第一個圖,主要用不同顏色表示不同行政區(qū)的美食數(shù)量,為了橫向比較一下數(shù)量,做了一個柱狀圖。
第二個圖則是將地理位置和價格聯(lián)系到一起,采用了熱力圖的形式,熱度表示價格,呈現(xiàn)了整個廣州市區(qū)的價格熱度分布。
商圈
在地理位置之后,就是從商圈分析,商圈作為城市宣傳或者美食指南中還是比較重要的,因為它涵蓋了一系列美食,往往還有配套的娛樂設施,具有一體化的特征,商圈的消費水平也是為消費者提供的一個重要參考。
第一步針對餐廳個體做出一個直方圖的分布,雖然上面一張PPT看上去滿眼全是紅色,但大部分的餐廳的人均消費水平都集中在50-100元的區(qū)間內,但同時也存在少部分大于500的極端值。
餐廳的級別以四星級和五星級為主,占比近9成,同時從直方圖的顏色可以看出除了兩個極端值外,各價位的星級分布沒有明顯差異。
這一張ppt我們統(tǒng)計了商圈的的人均價格中位數(shù)(剔除了商圈內包含樣本數(shù)小于5的商圈),發(fā)現(xiàn)處于頭部的四個商圈的人均價格中位數(shù)比剩余的高出一個斷層,我們可以認為這四家商圈定位是高端的消費群體,進一步我們繪制了它們的分布地理圖,從圖中可以主要看出天河,越秀,海珠,荔灣等區(qū)域的中心或交界處,從地理位置看處于整個廣州市的核心地帶。從標記點顏色看,最低的價格有人均60左右的,最高的高達人均500的水平,整體價格從顏色看符合高端消費。
這一張PPT我們看處于平價消費的四家商圈,分別為江南西,中山七八路,芳村,江南大道,右側是地理分布圖,這些商圈主要集中在荔灣的中下部和與越秀區(qū)接壤的部分,海珠區(qū)的中部等。從映射圖我們可以看出,基本沒有紅色的系比較深的點,整體人均價格在250以下,不存在任何極端值,這也能說明這些商圈的定位也是偏平價。
上面兩種相對立的,定位于不同消費群體商圈除了在地理位置上有所區(qū)別之外,還有沒有什么不同之處呢,我們對推薦菜品做了一個簡單的詞云分析,左側是人均消費大于200的高端消費商家的推薦餐品,右側是人均消費小于70的評價類商家的推薦菜品,我們還是可以明顯看出了有一些差別,左側主推的食物都是比較貴的,三文魚,刺身,鵝肝,食材比較稀有,對品質要求較高。右側的食物都是一些比較大眾的五花肉,炸腐竹等,偏常規(guī),食材易加工,附加價值較低。由此我們看出兩者除了在位置上有差異,食品類別也有差異,定位區(qū)分度大,不易產(chǎn)生直接競爭。
評分角度
從商圈角度討論完之后,我們從大家最關心的評分角度看一下廣州市的美食大眾點評得分上呈現(xiàn)什么規(guī)律。從圖形中看出口味、服務評分大致屬于中心分布,環(huán)境評分左偏。左偏分布說明廣州市的商鋪的整體環(huán)境較好,相對的得分較高。
同時我們觀察到環(huán)境評分和服務評分相關性較高,相關系數(shù)得到0.68,說明廣州作為一線城市,商圈整體的質量較高,對餐飲的軟性附加服務(服務質量和環(huán)境的)要求均達到很高的水準
此外,口味得分仍然是呈現(xiàn)一種中心分布,這也和食物口味這種東西相對來說更難量化,口味不一一等原因。
從菜系入手的菜品推薦
這兩頁ppt我們主要利用盒子圖發(fā)現(xiàn)廣州市提供的不同菜系的一些規(guī)律并給出推薦菜品。我們剔除了一些涵蓋樣本較少的菜系。
首先是價格分析自助餐和面包甜點的價格極差最大,整體來說自助,日料,西餐價格比較高,對于極差大的可以根據(jù)自己的消費能力選擇到合適的店鋪。
再是綜合得分分析,我們將口味服務環(huán)境簡單平均獲得綜合得分,韓國料理,日料,火鍋,粵菜的綜合評分極差很大,消費者挑選時注意踩雷的風險。
最后從綜合得分中選取了前10名的餐廳,菜系主要集中在日料、面包甜點,也有少量西餐火鍋粵菜;從地圖看出主要分布在天河、海珠、白云區(qū);人均價格從75-550元都有。感興趣的朋友可以去嘗試一下。
(三)技術支持tableau+pyecharts
所有的地圖主要完成都是通過pyecharts,本來可以用tableau的地圖真的很方便,但是由于它不好顯示行政區(qū)的邊界,最后還是放棄了,選擇碼代碼,用了geo和普通的地圖兩個模塊。但是如果tableau的地圖如果能把行政區(qū)的邊界做出來的話,可以省了很多麻煩。具體的代碼和數(shù)據(jù)我整理一下,如果想復現(xiàn)可以給我留言,歡迎大家交流學習。
總結
以上是生活随笔為你收集整理的pyecharts geo_pyechartstableau可视化分析案例+分析思路的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 大数据:互联网大规模数据挖掘与分布式处理
- 下一篇: git管理复杂项目代码