Python分析淘宝月饼销售数据,五仁月饼王者地位不可动摇
距離國慶中秋8天的假期沒幾天了,朋友圈各家大廠都開始秀自家定制的中秋月餅禮盒,假期要走親訪友的手里也少不了要提一盒月餅。
很多人學習python,不知道從何學起。
很多人學習python,掌握了基本語法過后,不知道在哪里尋找案例上手。
很多已經做案例的人,卻不知道如何去學習更加高深的知識。
那么針對這三類人,我給大家提供一個好的學習平臺,免費領取視頻教程,電子書籍,以及課程的源代碼!
QQ群:961562169
每年中秋節到,總會去姥姥那里送中秋,并買上各種各樣的月餅,那個時候科技并不怎么發達,不僅沒有這么多形形色色的月餅,也不知道哪些月餅賣得好? 月餅的價格分布是怎樣的呢? 什么地方的月餅銷量比較高呢? 簡直有十萬個為什么,希望別人給我們解答。
隨著科技的飛速發展,互聯網溝通了你我他。通過淘寶上月餅的銷量,就可以解決我們想要知道的好多問題。基于此,我爬取了淘寶上4000多條月餅的銷售數據,為大家展示了一幅漂亮的可視化分析儀表板,解決大家心目中的問題。
可視化大屏效果展示
數據采集
這次爬取淘寶,采用的是最簡單的方式:Selenium控制Chrome瀏覽器進行自動化操作,中途只需要掃碼登陸一次,即可完成整個數據的爬取。
這種方法極其好用,不會出現封IP、封號的情況,大家放心使用!
大家運行這個代碼之前,唯一要做的就是下載與谷歌版本相對應的chromedriver驅動,然后進行相關配置即可。其實關于淘寶整個數據爬取的過程,我之前為大家寫了一篇很詳細的文章,供大家參考。
部分爬蟲代碼如下:
數據清洗
數據清洗很重要,這個對于我們后續做可視化展示,極其重要。因此我們需要根據后面要做的圖形,然后進行對應的進行數據清洗。
爬取到的原始數據如下:
原始數據
整個數據看上去算是比較干凈,但是還是有幾個地方值得我們處理一下。
數據清洗部分代碼如下:
現在來看看,清洗后的數據是啥樣的?
數據清洗后的數據
可視化展示
可視化是整個文章的亮點所在,所謂“字不如表、表不如圖”。整個可視化分析我們基于以下五個問題開展而來。
鑒于整個文章排版,本文可視化部分的代碼均可在本文末尾獲取。
1、月餅銷量Top10的柱形圖
結論分析:銷量Top10的月餅,其實對于我們選購月餅還是挺有指導意義的。從圖中可以看到這個稻香村月餅,賣的還是極其好的,銷量排名前10的產品中,稻香村月餅占據了3個位置。還有一個名字特別熟悉:五芳齋,只知道他家的粽子做的好,原來月餅也做的不錯,所以說品牌效應還是很好的。那么你是否可以再看看,這些店里面是否有其他更好吃的點心呢?
2、店鋪月餅銷量Top10的柱形圖
結論分析:這里圖中顯示的結果,和第一張圖顯示的結果不謀而合,就不再過多的解釋了。唯獨感興趣的還是這個稻香村,為啥銷量如此好?百度一下得知原來是一家百年老店,附帶一張圖如下。
3、全國月餅銷量的地域分布地圖
結論分析:從圖中可以看出,廣東、浙江、山東、福建、北京的月餅銷量,在全國都是遙遙領先的。查閱資料可以發現,它們幾乎都有自己的品牌,像廣東的廣式月餅、浙江的衢式月餅、山東的魯式月餅等。廣式月餅重油重糖、京式月餅重油輕糖、魯式月餅口味清淡、蘇式月餅重甜。大家可以根據自己的需求,給親戚長輩們合理挑選符合口味的月餅哦。
4、不同價格區間的月餅銷量圓環圖
結論分析:當然價格才是大家關注的焦點。觀察上圖可以發現,月餅的價格幾乎是處在中間的、能被大家接受的范圍(22-115),再稍微貴一點的就是115-633這個區間(還可以接受),而處在633元以上的月餅幾乎為0。畢竟中秋節是一個傳統節日,適中的價格才能被大家接受,利潤就這么幾天,薄利多銷才是王道。
5、月餅銷售關鍵字的詞云圖
結論分析:從圖中可以看出,傳統的四大月餅(京式月餅、廣式月餅、滇式月餅、蘇式月餅)中廣式月餅極其受歡迎(PS:我還沒吃過),月餅口味上,小時候經常吃的五仁月餅的王者地位不可動搖,豆沙月餅提及率也很高,一直是很多孩子的最愛!還有現在出來的各種各樣的新鮮口味,像美心、酥皮、心奶、燕窩、白蓮等等,你到底喜歡哪一個呢?
總結
以上是生活随笔為你收集整理的Python分析淘宝月饼销售数据,五仁月饼王者地位不可动摇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微信群活码以及微信活码防封如何实现技术分
- 下一篇: 时间序列平稳性的判断和处理——R语言nd