帆软所有销量为0的显示为空值_爆品秘籍?—线上三亚跟团游销量影响因素分析...
如何在一次又一次的時下熱潮中,讓自己的旅行產(chǎn)品賣成爆品,正是旅行社所密切關(guān)心的。我們以三亞跟團游在線旅游產(chǎn)品為例,對銷量的各個可能影響因素進行描述建模,并對消費者評論內(nèi)容進行詞頻統(tǒng)計、利用LDA模型進行主題挖掘,將文本挖掘得到的主題出現(xiàn)概率作為衍生自變量加入到后續(xù)回歸模型中,最終以產(chǎn)品是否有歷史銷量和月平均銷量分布作為因變量建立模型,為旅行社探索挖掘相關(guān)信息,提供修改旅行產(chǎn)品的建議。
背景介紹
沙灘、椰風(fēng)、海韻,三亞這座城市擁有60%的森林覆蓋率,209.1公里的海岸線,擁有19處優(yōu)質(zhì)海灣。近十年,三亞已建成23處別具特色的旅游景區(qū),例如:三亞灣椰夢長廊、西島海上游樂世界、“蜈支洲島”度假中心、天涯海角風(fēng)景區(qū)等。三亞現(xiàn)有近200家旅游飯店,四、五星級酒店近30家。2018年,三亞市接待游客總?cè)藬?shù)2242.57萬人次,比2017年增長11.3%。全年旅游總收入514.73億元。全市共有A級及以上景區(qū)14處,其中,5A景區(qū)3處,4A景區(qū)5處。三亞已經(jīng)形成完整、極具吸引力的旅游產(chǎn)品體系,這就是本文之所以選取三亞這座城市作為研究目標(biāo)的原因。
縱觀線上旅游市場,OTA市場交易規(guī)模平穩(wěn)增長,在線產(chǎn)品預(yù)定也呈多元化發(fā)展。在線旅游業(yè)的整體格局已經(jīng)趨于穩(wěn)定,隨著旅行細(xì)分市場運營發(fā)展日益精細(xì)化,在線旅游市場份額日趨穩(wěn)定,突圍壁壘增高,窗口逐漸縮小,市場集中度進一步提升。2018年在線旅游交易額達到1.2萬億。
據(jù)某網(wǎng)站發(fā)布的報告顯示,有超過70%的游客在外出旅游時選擇了跟團游產(chǎn)品,以家庭為單位的私家團人數(shù)更是暴增105%。跟團游產(chǎn)品仍然火爆,在線旅游蓬勃的發(fā)展以及市場交易額也不斷擴大,那么如此廣闊的市場發(fā)展前景就必然成為商家的必爭之地。這么多線上旅行社如何在競爭激烈的市場上,拔得頭籌,將自己的產(chǎn)品賣成爆品?
小編決定從“獲客困難”這一問題為切入口,基于線上三亞跟團游產(chǎn)品銷量的影響因素分析,為旅行社獲得更多銷量及更高利潤,并從消費者評論角度直擊旅行社痛點。
數(shù)據(jù)描述
本文所使用的數(shù)據(jù)抓取自某大型在線旅游網(wǎng),選擇所有熱門城市為出發(fā)地逐個爬取,并去重,留下共1813條樣本,每條數(shù)據(jù)代表一個三亞跟團游產(chǎn)品的相關(guān)信息。其中有銷量信息的樣本共610條,有評論信息的共455條。
描述分析
我們發(fā)現(xiàn)所爬取1813條數(shù)據(jù)中,有銷量信息的跟團游產(chǎn)品經(jīng)610個,故本次研究將因變量一分為二,首先對產(chǎn)品是否有歷史銷量進行影響因素分析。再對有銷量的產(chǎn)品進行銷量標(biāo)準(zhǔn)化處理,分析其影響因素。
01 因變量:線上三亞跟團游產(chǎn)品是否有銷量
該網(wǎng)上所有三亞跟團游產(chǎn)品有歷史銷量的僅由610個,占比33.6%。
自變量描述,以是否有購物、產(chǎn)品價格是否可見行程地圖為例。分析如下:
我們發(fā)現(xiàn)無購物的跟團游產(chǎn)品獲客能力比有購物的產(chǎn)品強,有銷量的產(chǎn)品總體價格低于無銷量的產(chǎn)品。
可見行程地圖的產(chǎn)品獲客能力明顯強于不可見行程地圖的產(chǎn)品,行程地圖的展示能幫助消費者直觀了解整體行程,也能使消費者更愿意長時間停留在該產(chǎn)品頁面上,提高購買概率。
02 因變量:三亞跟團游產(chǎn)品月平均銷量
我們選取所有有歷史銷量的產(chǎn)品,利用產(chǎn)品評論最早日期代替上線日期,進行標(biāo)準(zhǔn)化處理,排除上線時長對銷量的影響,得到我們所關(guān)心的因變量——三亞跟團游產(chǎn)品月平均銷量。做對數(shù)處理,繪制如下直方圖,整體呈右偏分布,大部分產(chǎn)品銷量小于10(人/月)。銷量最大值高達700.87(人/月),來自該網(wǎng)旅游自營的海南三亞5鉆5日4晚跟團游產(chǎn)品。
自變量描述,以行程天數(shù)、總共景點個數(shù)與產(chǎn)品好評率為例。分析如下:
行程天數(shù)在3天到9天的跟團游產(chǎn)品最受消費者歡迎,旅行社在制定產(chǎn)品的時候應(yīng)該更多的制定行程在這一范圍之間的產(chǎn)品。行程中景點個數(shù)在3至9個的產(chǎn)品銷量離散值較多,可見三亞跟團游爆品所安排的旅行景點總數(shù)集中在3至9個范圍內(nèi)。旅行社在安排跟團游景點個數(shù)的時候需要適中,過多景點個數(shù)會導(dǎo)致成本增加。
好評率是使用過該產(chǎn)品的消費者所帶來的量化反饋,反映大眾對產(chǎn)品的看法。我們由圖可知,好評率在96%~99%的產(chǎn)品總體銷量明顯高于其他范圍的產(chǎn)品,三亞跟團游的爆品也出現(xiàn)在這個好評率范圍內(nèi)。
有趣的是,存在一部分滿意度高達100%但銷量卻不高的產(chǎn)品,可能原因是這些產(chǎn)品是該網(wǎng)站上較新的產(chǎn)品,也可能因為廣告宣傳力度不夠大,導(dǎo)致部分質(zhì)量高的產(chǎn)品沒被大眾所發(fā)現(xiàn)。
評論內(nèi)容總體描述
首先我們將該網(wǎng)上所有跟團游的產(chǎn)品評論信息全部爬取出來,共455個商品有評論內(nèi)容。經(jīng)過去停用詞、新增語料庫、分詞,再令評分大于3分的劃分為好評,其余為差評,各選取出現(xiàn)頻率top140的詞繪制如下詞云圖。好評中出現(xiàn)頻率最多的詞有:酒店、服務(wù)、幽默、熱情、景點等等。而差評中出現(xiàn)最多的詞是:酒店、購物、自費、客服、時間、項目等。
基于LDA對評論內(nèi)容主題模型建立
我們將該455個產(chǎn)品的所有評論內(nèi)容進行預(yù)處理,利用LDA模型進行主題挖掘產(chǎn)品特征。打印了前六個主題模型,并提取頂級詞匯我們對LDA主題模型進行可視化,結(jié)果是一個動態(tài)交互的網(wǎng)頁,下圖僅展示主題4,由下圖右方,可知大體與導(dǎo)游因素有關(guān)。
同樣地,對其它主題同樣進行可視化,根據(jù)每個主題給出的前10個頂級詞匯,下表展示各主題前10個頂級詞匯及其歸納的類別。評論主題一定程度上反映消費者的關(guān)注點與需求。我們?yōu)槊總€產(chǎn)品計算其評論各個主題特征出現(xiàn)的概率,即各個產(chǎn)品在各個類別里的打分,并運用到后續(xù)回歸模型之中,觀察其對銷量的影響是否顯著。
回歸模型建立
01 邏輯回歸(是否有歷史銷量)
1.1 模型建立與解讀
首先我們對該網(wǎng)網(wǎng)上所有三亞跟團游產(chǎn)品,以是否有歷史銷量為因變量建立初始邏輯回歸模型?;贐IC準(zhǔn)則,利用向后逐步回歸,進行變量選擇。得到如下所示最終回歸模型。
從估計的結(jié)果來看,在顯著性水平為0.05的情況下,有以下三點值得關(guān)注:
1.該網(wǎng)自營的產(chǎn)品相比于非該網(wǎng)自營的更容易受到消費者“光顧”;
2.網(wǎng)頁上可見行程地圖的產(chǎn)品比不可見地圖的產(chǎn)品更容易賣得出,這可以結(jié)合網(wǎng)頁上顯示自由活動次數(shù)這一因素,我們發(fā)現(xiàn)只要顯示自由活動次數(shù)的產(chǎn)品相較于無信息的產(chǎn)品獲客能力更強,可見線上旅行產(chǎn)品的“門面”何其重要!
3.有購物的跟團游產(chǎn)品相較于無購物的產(chǎn)品,更不容易被賣出。
1.2 模型的評價
我們建立混淆矩陣,本案例設(shè)置的闕值是樣本的正負(fù)比例(有銷量產(chǎn)品占總產(chǎn)品的比例)。根據(jù)混淆矩陣我們可知,模型的錯分率為44.60%,偏高;TPR(True Positive Rate)為70.05%,預(yù)測1正確的能力較好;FPR(False Positive Rate)為31.67%,錯將1預(yù)測為0的概率降低。AUC=0.77。
1.3.模型運用
02
線性回歸(月平均銷量)
2.1 模型的建立與解讀
該部分,我們選擇月平均銷量作為因變量,建立初始線性回歸模型,利用AIC準(zhǔn)則,向后逐步回歸進行變量選擇。并計算了cook距離,去除強影響點,最終選擇對數(shù)線性回歸模型,得到下表。
F檢驗的p值小于顯著性水平(0.05),因此模型整體是顯著的,至少有一個自變量對于產(chǎn)品月銷量有顯著影響。本案例的R方為0.633,自變量能夠解釋因變量(跟團游產(chǎn)品月平均銷量)變異的63.3%。
具體解讀如下:
(1)產(chǎn)品自身因素:當(dāng)控制其他因素不變的時候,該網(wǎng)自營的跟團游產(chǎn)品月平均銷量比非該網(wǎng)自營的平均高出80.01%,產(chǎn)品是否安排購物與產(chǎn)品價格仍然是一個很重要的因素。還值得關(guān)注的是跟團游安排的行程天數(shù),3至9天的產(chǎn)品比3天及以內(nèi)的產(chǎn)品的月平均銷量高出36.58%,太短的行程并不適合大部分人。
(2)產(chǎn)品評價因素:在控制其他因素不變的情況下,好評率提高1%,月平均銷量就會增高2.28%。我們還將挖掘出來的評論內(nèi)容主題在各個產(chǎn)品評論里出現(xiàn)概率放入模型中,發(fā)現(xiàn)吃住因素、導(dǎo)游因素和行程路線的得分是影響產(chǎn)品銷量較強的因素。
2.2 模型評價
下方輸出的一組診斷圖,從殘差圖能夠看出,異方差的現(xiàn)象并不明顯。QQ圖告訴我們,正態(tài)性得到了很好的滿足。而右下角的Cook距離圖顯示,樣本已無強影響點。
2.3 模型應(yīng)用
如下圖回歸系數(shù)可視化展示我們發(fā)現(xiàn)產(chǎn)品好評率所有影響因素中影響力最強的,好評率高說明消費者對該產(chǎn)品的滿意度高,這樣的產(chǎn)品更容易成為“爆品”。
再解釋產(chǎn)品自身因素的影響,從我們的模型中可以看到有三個因素與平均月銷量的負(fù)相關(guān)性很明顯,分別是有購物(基準(zhǔn)組:無購物)、價格和自由活動次數(shù)。
而評論內(nèi)容所挖掘的主題對于月平均銷量的解釋:六個主題中有五個主題對銷量的解釋較為顯著。其中,導(dǎo)游因素的得分與行程線路的得分對平均月銷量的影響較大,這說明,消費者在購買并完成該產(chǎn)品旅程之后,對導(dǎo)游與整體行程安排的印象最深。除此之外,吃住因素的得分對銷量也具有較大影響,而吃住因素的得分自然取決于旅行社設(shè)計跟團游產(chǎn)品的時候是否妥當(dāng)。
不過,同時期的數(shù)據(jù)進行建模,結(jié)果只能用于解釋。但對于平臺方而言,能夠收集到更多的產(chǎn)品信息,可以使用銷量前期對應(yīng)的評論數(shù)等其他信息進行建模,從而可以進一步用于銷量預(yù)測等工作。
總結(jié)與建議
下方是根據(jù)全文分析結(jié)果提出對旅行社的建議:
總結(jié)
以上是生活随笔為你收集整理的帆软所有销量为0的显示为空值_爆品秘籍?—线上三亚跟团游销量影响因素分析...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 16进制如果换算后第一个是字母,前面必须
- 下一篇: 人事管理系统 数据流图_中国移动集中化人