公司用户画像项目总结
目錄
用戶畫像是什么?
標簽
畫像和標簽
參數(shù)化標簽?
標簽的權重?
標簽分類
標簽建模
畫像數(shù)據(jù)產(chǎn)出
特征標簽
建模標簽
模型預測標簽
對自己在畫像項目的一些總結
用戶畫像是什么?
用戶畫像分為畫像和興趣
- 用戶畫像
????????靜態(tài),包括基礎屬性、地理屬性、行為屬性等,應用于客群分析和營銷活動。
????????常見的場景:APP應用架構層級的千人千面、營銷活動圈定人群。
- 用戶興趣
????????動態(tài),包括即時興趣、短期興趣、長期興趣等,應用于推薦系統(tǒng)和內(nèi)容推薦。
????????常見的場景:搜索欄、商品/內(nèi)容收藏、購買等。
標簽
畫像和標簽
用戶畫像:用戶信息標簽的一個集合,也可說用戶畫像通常以標簽落地
參數(shù)化標簽?
標簽背后有嚴格的口徑定義,比如我們定義:
????????標簽【偏好王者榮耀】代表【過去1個月下過5次王者訂單的人群】
后面口徑修改【過去1個月下過10次王者訂單的人群】,此時需要廢棄舊的標簽,重新生產(chǎn)新的標簽,這顯然是不合理的
參數(shù)化即把標簽口徑中可變的部分設置為參數(shù),【偏好王者榮耀】代表【過去N個月下過M次王者訂單的人群】
標簽的權重?
每個標簽都要有權重
標簽分類
標簽分為幾類:
????????1. 統(tǒng)計類
????????包括直接提取的標簽,又叫事實標簽
????????包含用戶的基本信息以及用戶行為聚合的比如下單次數(shù)
????????2. 規(guī)則類
? ? ? ? 需要自定義規(guī)則,又叫建模標簽,由人來指定,滿足一定條件的
? ? ? ? 3.機器學習標簽
? ? ? ? 非確定性的標簽,又叫預測標簽
標簽建模
按照維度劃分標簽:
????????將標簽按照內(nèi)容橫向分開
????????基本社會屬性,行為習慣,購買能力,興趣愛好等
設置分級標簽模型
將標簽按照模型縱向分開
畫像:用戶信息標簽的一個集合
用戶行為可追溯,把用戶的行為勾勒出一個用戶的信息全貌,個性化服務
根據(jù)數(shù)據(jù),生產(chǎn)標簽
畫像數(shù)據(jù)產(chǎn)出
畫像有幾部分組成的
特征標簽
首先有一部分是一個大表,屬于畫像特征,這部分是統(tǒng)計類又叫事實標簽,可以直接從數(shù)據(jù)提取,不需要建模
CREATE TABLE IF NOT EXISTS dwd_user_trade_features ( --這里按類型給一個大概uid BIGINT COMMENT '用戶uid',nickname STRING COMMENT '用戶昵稱',mobile STRING COMMENT '用戶手機號',gender BIGINT COMMENT '性別 0=女 1=男 2=未知',age BIGINT COMMENT '年齡',constellation STRING COMMENT '星座',create_time DATETIME COMMENT '注冊日期',register_days BIGINT COMMENT '注冊天數(shù)',province STRING COMMENT 'ip所在省份',city STRING COMMENT 'ip所在城市',diamond_amount DECIMAL COMMENT '鉆石余額'--活躍,包含最近 3,7...181天等口徑,我們最高是181天的,login_days BIGINT COMMENT '登錄天數(shù)',last_login_date DATETIME COMMENT '最后一次登錄日期',keep_days BIGINT COMMENT '留存天數(shù)(最后登陸時間-注冊時間)',leave_days BIGINT COMMENT '未登錄天數(shù)(當下時間-最后登陸時間)',login_num_3 BIGINT,login_num_7 BIGINT,login_num_14 BIGINT,login_num_30 BIGINT,login_num_60 BIGINT,login_num_90 BIGINT,login_num_120 BIGINT--動態(tài),粉絲,關注,點贊等,包含最近 3,7...181天等口徑,fans_counts BIGINT COMMENT '粉絲總數(shù)',follow_users BIGINT COMMENT '關注用戶數(shù)',loss_recommend_dongtai_counts BIGINT COMMENT '曝光動態(tài)次數(shù)',loss_recommend_dongtai_users BIGINT COMMENT '曝光動態(tài)用戶數(shù)',loss_click_dongtai_counts BIGINT COMMENT '點擊動態(tài)數(shù)',loss_click_dongtai_users BIGINT COMMENT '點擊動態(tài)用戶數(shù)',loss_reply_dongtai_counts BIGINT COMMENT '評論動態(tài)數(shù)',loss_reply_dongtai_users BIGINT COMMENT '評論動態(tài)用戶數(shù)',loss_zan_dongtai_counts BIGINT COMMENT '點贊動態(tài)數(shù)',loss_zan_dongtai_users BIGINT COMMENT '點贊動態(tài)用戶數(shù)',loss_play_dongtai_users BIGINT COMMENT '播放動態(tài)視頻用戶數(shù)',loss_play_dongtai_counts BIGINT COMMENT '播放動態(tài)視頻次數(shù)',loss_play_dongtai_times BIGINT COMMENT '播放動態(tài)視頻時長,單位:秒',loss_view_my_profile_users BIGINT COMMENT '瀏覽我的主頁用戶數(shù)'-- 商家,這個可能有兩部分,一部分是你下單和被下單等等,is_god BIGINT COMMENT '是否是大神',god_income DECIMAL COMMENT '大神收入總額',god_from_users BIGINT COMMENT '付費給大神的人數(shù)',god_first_trade_date DATETIME COMMENT '大神第1次接單時間',god_last_trade_date DATETIME COMMENT '大神最后1次接單時間',order_amount DECIMAL COMMENT '下單總額',order_num BIGINT COMMENT '下單次數(shù)',order_to_users BIGINT COMMENT '下單用戶數(shù)',each_order_avg_amount DECIMAL COMMENT '平均每筆下單金額'--直播聊天室等,還有一些房間類型等等,is_live_enter BIGINT COMMENT '是否進入過直播間',live_enter_num_3 BIGINT COMMENT '最近N天進入直播間次數(shù)',live_room_to_users_3 BIGINT COMMENT '最近N天直播打賞用戶數(shù)',live_view_time_3 BIGINT COMMENT '最近N天觀看直播時長(單位:秒)',chatroom_view_room_3 BIGINT COMMENT '最近N天訪問房間個數(shù)' );建模標簽
還有一部分是需要建模的
這種畫像標簽需要你事先定義好,每一個標簽對應一種口徑
用戶行為標簽表表結構:
?
模型預測標簽
還有預測標簽,這部分我沒有處理過,不是很清楚
總結
以上是生活随笔為你收集整理的公司用户画像项目总结的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java学到什么程度才算精通?(2),学
- 下一篇: 芮勇出任联想CTO,阿里巴巴获CIKM