基于动态混合高斯模型的商品价格模型算法
生活随笔
收集整理的這篇文章主要介紹了
基于动态混合高斯模型的商品价格模型算法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 背景
? ??作為電子商務網站,淘寶網上的每個商品都有一個價格,該價格從一個很重要的維度上反應出一個商品的品質。但是由于該價格是由第三方賣家自己確定的,因此存在一定的隨機性。一個價格過低的商品,其假貨的可能性往往較大,比如500元的勞力士手表,或者商品的質量存在問題;同時一個價格過高的商品,可能會失去一個潛在的購買者,也可能會是賣家故意設置高價,以便用戶按價格排序時展現在靠前的位置。? ? 因此對一個商品當前價格的合理性進行判斷,并根據該商品的屬性給出其合理的價格區間,對于規范淘寶網的商品運營以及搜索結果展現方面都具有重要的作用。
2. 應用場景
? ??本算法目前主要用于三個場景:3. 技術方案
3.1 概述
? ? 本算法提出三個優化點來判斷一個商品的價格合理性并給出一個合理的價格區間:3.2 詳細流程
3.2.1. 獲得同款數據
? ? 第一步是獲取商品的同款信息,只有基于同款的情況下,才能利用大數據對商品的合理價格進行預測。目前使用到的同款數據主要有以下三個:3.2.2 訓練樣本集獲取
? ? 獲取了同款數據之后,需要從里面找到價格有問題的樣本,首先需要獲取其中可信任的樣本,當前從三個維度獲取可信樣本:3.2.3 基于動態高斯模型的商品價格模型
? ? 在獲取了同款下商品的訓練樣本之后,使用高斯模型獲得其分布的均值、方差等信息。在本方法中對傳統的高斯模型進行了兩處優化:? ? 本算法中會首先使用雙高斯模型計算出當前訓練樣本的分布情況,同時會根據具體的樣本信息決定使用雙高斯模型還是單高斯模型。
? ??判斷雙高斯是否合適的方法:
? ??判斷是否使用單高斯模型的邏輯有兩個
? ? 去除奇異點的目的主要是為了解決當前同款數據中本身存在的噪聲問題,讓訓練的樣本更加收斂。主要方法是在雙高斯模型情況下,若其中一個模型中的樣本量過少,而另一個模型中的樣本量很多,那么樣本量少的可以作為奇異值進行去除。比如在同一款中,大量的價格聚集在100元,只有少量的價格聚集在20元,那么20元周圍的樣本可以作為奇異值進行去除。具體的閾值等信息根據情況進行設置。
?
? ? 通過該方法計算出每個同款下商品價格的分布情況,在預測時,可以直接通過查表的方式找到該同款下每個商品價格的合理性概率值。
4. 效果與后續計劃
4.1 當前識別效果
? ? 當前價格模型的數據分別在假貨識別、商品品質、超低價商品降權中得到應用。4.2 后續計劃
? ? 在價格模型后續的工作中,會從以下幾個方面進行開展:總結
以上是生活随笔為你收集整理的基于动态混合高斯模型的商品价格模型算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: centos7 安装redmin3.3.
- 下一篇: .net 实现Cookie跨域共享,单点