南方人过冬有多难?用Python带你分析全网取暖器销量数据
?
CDA數據分析師 出品
作者:Mika數據:真達
如果說冬天對北方人來說只是一個季節,而對南方人來說是一場“渡劫”。北方的冷是干冷,物理攻擊,多穿一點就好了。而且室內有暖氣,在室內可以穿著短袖吃冰棍。
而南方的冷是濕冷,魔法攻擊,穿再多沒有用。而且室內還沒暖氣,各種段子也是層出不窮:
“你在北方的暖氣里四季如春,我在南方的寒冬下凍成冰棍兒”
“北方人過冬靠的是暖氣,南方人過冬靠的是一身正氣”
“我是一只來自北方的狼,來到南方卻被凍成了狗”
一到冬天南方人除了靠一身浩然正氣,空調、電熱毯、油汀、電暖氣等各類花式取暖電器都得安排上。
內貿批發平臺1688上獲取的數據顯示,進入11月以來,暖氣片在南方城市的銷量比去年同期增長了300%,平臺上取暖小家電品類整體營業額同比增幅達到200%,其中發熱墊的同比增速甚至高達600%。
據顯示,暖氣片和暖氣設備銷量貢獻最大的國內客戶,主要都是來自長江沿線城市,以江浙滬、安徽、湖南、湖北、重慶、四川等地居多,一時間“南方取暖設備被買爆”話題登上了微博熱搜,讓人不禁感嘆南方人過個冬天實在是太難了。
那么取暖器的全網銷售數據是怎樣的呢?今天我們就帶你用看一看。
用Python分析全網取暖器數據
我們使用Python獲取了淘寶網搜索關鍵詞暖氣片、取暖器、壁掛爐的商品數據,并進行了數據分析。
1.讀取數據首先導入獲取的數據。
#導入工具包import numpy as np import pandas as pd from pyecharts.charts import Bar, Pie, Map, Pagefrom pyecharts import options as optsimport jieba
#讀取數據df_all = pd.read_csv(’…/data/導出數據.csv’)df_all.head()
df_all.shape(13212, 7)
2.數據清洗和整理
此處我們需要對數據集進行數據清洗以便后續分析和可視化,主要工作內容如下:
刪除記錄的重復值
goods_price列處理:提取數值
purchase_num列處理:提取數值
計算銷售額sales_volume =
goods_price*purchase_num
刪除多余的列
代碼實現如下:
df = df_all.copy()# 去除重復值df.drop_duplicates(inplace=True)df.shape(6849, 7)#
篩選記錄
df = df[df[‘purchase_num’].str.contains(‘人付款’)]# goods_price列處理df[‘goods_price’] = df[‘goods_price’].str.extract(’(\d+.{0,1}\d*)’) df[‘goods_price’] = df[‘goods_price’].astype(‘float’)# purchase_num列處理df[‘num’] = df[‘purchase_num’].str.extract(’(\d+.{0,1}\d*)’)df[‘num’] = df[‘num’].astype(‘float’) df[‘unit’] = [10000 if ‘萬’ in i else 1 for i in df[‘purchase_num’]]# 計算銷量df[‘purchase_num’] = df[‘num’] * df[‘unit’]# 計算銷售額df[‘sales_volume’] = df[‘goods_price’] * df[‘purchase_num’]# 提取省份字段 df[‘province_name’] = df[‘location’].astype(‘str’).str.split(’ ').apply(lambda x:x[0]) # 刪除多余的列df.drop([‘num’, ‘unit’, ‘detail_url’], axis=1, inplace=True)# 重置索引df = df.reset_index(drop=True)df.head()
3.數據可視化
此處我們對店鋪銷量、產地分布、商品價格等方面進行可視化分析:
市場上的取暖器種類較多,有暖風機、小太陽、電熱膜、油汀、快熱爐、踢腳線等取暖設備,我們首先看到這些取暖器的標題詞云。
商品標題詞云圖
可以看到"取暖器" “暖風機” “暖氣片"都是出現的高頻詞。在特征方面"家用” “節能” "速熱"都十分常見。
接著,看到店鋪月銷量排名Top10。
店鋪月銷量排名Top10
可以看到店鋪銷量前十,凱瑞萊旗艦店位居第一。其后春尚電器專營店和蘇寧易購分別是第二第三名。排在前十的還有美的、tcl等品牌。
#計算top10店鋪shop_top10 = df.groupby(‘shop_name’)[‘purchase_num’].sum().sort_values(ascending=False).head(10)
不同價格區間的商品數量占比
取暖器都賣多少錢呢?經過分析發現,100元以下的商品是最多占比高達34.76%。其次是200-500元的商品,占比22.09%。
不同價格區間的銷量占比
與此同時,在銷量方面,價格在100元以下和100-200元之間的取暖產品也是銷量最好的,全網銷售量分別占比37.49%和35.92%。
結語
有了各式各樣的取暖器,南方冬天就好過了嗎?并不,空調開久了干,踢腳線耗電高,油汀等電暖氣更適合局部取暖,大空間制熱效果差。
雖然近年來也有很多南方家庭選擇全房裝地暖的,然而電暖用起來一個月電費就高達2、3千,這可能就是北方一個冬天的暖氣費用了。這么對比起來,似乎還是開空調和取暖器實在啊。
總結
以上是生活随笔為你收集整理的南方人过冬有多难?用Python带你分析全网取暖器销量数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Ubuntu中安装和使用vim
- 下一篇: hdu 5745 La Vie en r