11.11分析笔记
('會員積分怎么設置?\n', '會員 積分 設置', '如何設置會員積分?\n', '設置 會員 積分', 0.9019373320764608)
('會員積分怎么設置?\n', '會員 積分 設置', '會員積分怎么設置?\n', '會員 積分 設置', 0.9019373320764608)
?
怎么 跟 如何 可以在停用詞當中去掉了,因為我們可以訓練得到這兩個詞很接近
?==============================
'為什么會員消費之后,沒有直接積分呢?\n', '會員 消費 積分', 0.5525826385676638)
直接和沒有這兩個詞,要考慮一下是否可以保留,
?
('從哪選全部盤點?\n', '選 盤點', '從哪選全部盤點?\n', '選 盤點', 0.8849686222482205)
('從哪選全部盤點?\n', '選 盤點', '盤點可以多人盤點嗎\n', '盤點 盤點', 0.5671144704214331)
('從哪選全部盤點?\n', '選 盤點', '怎么盤點?\n', '盤點', 0.5538840002517338)
?多人,要保留,從哪,要看一下怎么分詞,是否要保留這個詞
?
?
全部要從自定義詞典去掉
('從哪選全部盤點?\n', '選 盤點', '盤點可以多人盤點嗎\n', '盤點 盤點', 0.5671144704214331)
('買單時候新增會員,為什么沒有積分累計的?\n', '買單 新增 會員 積分 累計', '會員結賬完了積分沒有累積到會員積分呢?\n', '會員 結賬 完 積分 累積到 會員 積分',
?
?
【下周工作內容】:
將對比度增強實現,并測試
將問題庫整理出來,寫一個正式的服務,可以輸入問題,去匹配問題庫的答案。
然后考慮如何上線的問題。我們上線之后,才可以采集更多的優質問題,也可以讓人工幫忙判別匹配出來的問題對不對,再根據用戶問的最多的問題,去寫答案?
?
并且確定我們之后要進行增量更新、訓練的方案。甚至要設計AB測試的方案。
?
?
而且,最終我們應該要先進行正則匹配,匹配到了一些問候語什么的,根據這些問候語再給答案。
?
設計多輪對話的方案,需求:
應用于服務,比如密碼修改、會員積分修改之類的
對于相似問題的選擇
對于所屬訂單的選擇
用于售前的推薦、套電等服務
?
去仔細測試各個智能客服。及功能
?
結果分析 新
需要增加停用詞的搜索:停用詞
自定義詞典:自定義
===
('預付卡怎么設置?\n' '預付卡 設置' '預付卡怎么設置?\n' '預付卡 設置' 1.0)
('預付卡怎么設置?\n' '預付卡 設置' '母嬰版次卡如何設置?\n' '母嬰版 次卡 設置' 0.3162688133522602)
('預付卡怎么設置?\n' '預付卡 設置' '怎么設置贈送?\n' '設置 贈送' 0.2961592683431777)
('預付卡怎么設置?\n' '預付卡 設置' '次卡要怎么操作?\n' '次卡 操作' 0.2874500143882496)
('預付卡怎么設置?\n' '預付卡 設置' '設置權限在哪里?\n' '設置 權限' 0.2821660567361152)
應該是因為預付卡在WORD2VEC訓練的時候出現的次數太少,沒有一個準確的向量,似乎跟次卡的向量非常接近
===
('需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' '需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' 1.0)
('需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' '微信店鋪怎么開通\n' '微信店鋪 開通' 0.2578615360377437)
('需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' '如何開通微信店鋪\n' '開通 微信店鋪' 0.2578615360377437)
('需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' '微信通知收費的嗎\n' '微信通知 收費' 0.2578143652556853)
('需要付費開通的微信通知,里面具體都包含什么功能?\n' '付費 開通 微信通知 包含 功能' '微信通知收費嗎?\n' '微信通知 收費' 0.2578143652556853)
微信店鋪跟微信通知似乎比較接近,然后微信通知收費等的相似度又不夠高,講道理,我們應該加強如果是主語詞相同,應該加強權重
===
('門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' '門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' 1.0)
('門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' '怎么使用購物卡\n' '使用 購物卡' 0.26711945798879294)
('門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' '系統里的優惠券怎么使用?\n' '系統 優惠券 使用' 0.25519426261904476)
('門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' '優惠券功能怎么用?\n' '優惠券 功能' 0.23672450604885462)
('門店收銀為什么不能使用不了優惠券?\n' '門店 收銀 使用 優惠券' '優惠券號是什么?\n' '優惠券 號' 0.23434118731135392)
第二個不應該相似度很高的其實,還是得有句法分析。而且我發現短句子很容易跟任何句子相似,如果這個相似值的增加是固定的,那我們是否要給短句子減去
===
('配方卡支持嗎?\n' '配方 卡 支持' '配方卡支持嗎?\n' '配方 卡 支持' 1.0)
('配方卡支持嗎?\n' '配方 卡 支持' '怎么設置原材料配方?\n' '設置 原材料 配方' 0.26324883204167576)
配方卡應該加入自定義詞典?
===
('送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' '送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' 1.0)
('送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' '次卡要怎么操作?\n' '次卡 操作' 0.27973469187173616)
('送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' '優惠券多送或者送錯了怎么辦?\n' '優惠券 送 送錯' 0.26911013719612215)
('送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' '怎么送顧客優惠券呢?\n' '送 顧客 優惠券' 0.2604935387861817)
('送出優惠券要取消怎么操作?\n' '送 優惠券 取消 操作' '優惠券功能怎么用?\n' '優惠券 功能' 0.24635740563784142)
第二個還是因為長度很短,匹配有利
===
('這款機器如何綁定美團外賣?\n' '款 機器 綁定 美團 外賣' '這款機器如何綁定美團外賣?\n' '款 機器 綁定 美團 外賣' 1.0)
('這款機器如何綁定美團外賣?\n' '款 機器 綁定 美團 外賣' '你們對接外賣嗎?怎么對接?\n' '對接 外賣 對接' 0.23920113725287792)
('這款機器如何綁定美團外賣?\n' '款 機器 綁定 美團 外賣' '外賣對接你們能直接處理么?\n' '外賣 對接' 0.23920113725287792)
('這款機器如何綁定美團外賣?\n' '款 機器 綁定 美團 外賣' '能對接餓了么美團外賣?\n' '對接 餓了么 美團 外賣' 0.23903948356060964)
相似度還是太低,很容易被噪音干擾。而且停用詞 款
===
('這個機子積分怎么弄的?\n' '機子 積分 怎么弄' '這個機子積分怎么弄的?\n' '機子 積分 怎么弄' 1.0)
('這個機子積分怎么弄的?\n' '機子 積分 怎么弄' '網店怎么弄?\n' '網店 怎么弄' 0.24481832036859622)
('這個機子積分怎么弄的?\n' '機子 積分 怎么弄' '盤點怎么弄?\n' '盤點 怎么弄' 0.2442147262460252)
怎么弄,要作為停用詞去掉
===
('返現的金額,會員都會收到短信的吧?\n' '返現 金額 會員 收到 短信' '返現的金額,會員都會收到短信的吧?\n' '返現 金額 會員 收到 短信' 1.0)
('返現的金額,會員都會收到短信的吧?\n' '返現 金額 會員 收到 短信' '會員消費能收到短信嗎?\n' '會員 消費 收到 短信' 0.23331245830230476)
('返現的金額,會員都會收到短信的吧?\n' '返現 金額 會員 收到 短信' '我的會員消費怎么沒有短信通知?\n' '會員 消費 短信 通知' 0.21501081299625882)
('返現的金額,會員都會收到短信的吧?\n' '返現 金額 會員 收到 短信' '銀豹收銀會員怎么用短信通知會員\n' '銀豹 收銀 會員 短信 通知 會員' 0.20778119896462863)
問題庫里,關于返現的只有一條
===
('超市會員購物送積分在哪設置呢?\n' '超市 會員 購物 送 積分 設置' '超市會員購物送積分在哪設置呢?\n' '超市 會員 購物 送 積分 設置' 1.0)
('超市會員購物送積分在哪設置呢?\n' '超市 會員 購物 送 積分 設置' '如何設置會員積分?\n' '設置 會員 積分' 0.24079118758697474)
('超市會員購物送積分在哪設置呢?\n' '超市 會員 購物 送 積分 設置' '會員積分怎么設置?\n' '會員 積分 設置' 0.24079118758697474)
關于超市會員只有這一條問題
===
('購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' '購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' 1.0)
('購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' '怎么使用購物卡\n' '使用 購物卡' 0.20717199862816027)
('購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' '次卡要怎么操作?\n' '次卡 操作' 0.2021474643162684)
('購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' '優惠券功能怎么用?\n' '優惠券 功能' 0.20193648553791035)
('購物卡和儲值卡都有余額 扣款順序是先購物卡嗎\n' '購物卡 儲值卡 余額 扣款 順序 先 購物卡' '購物卡如何核銷\n' '購物卡 核銷' 0.20182042171018685)
問句太長,描述太長,無法相似
===
('請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' '請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' 1.0)
('請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' '如何設置會員積分?\n' '設置 會員 積分' 0.21872857148542862)
('請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' '會員積分怎么設置?\n' '會員 積分 設置' 0.21872857148542862)
('請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' '我批量設置里面積分設置怎么沒有了?\n' '批量 設置 積分 設置' 0.21654949677543572)
('請問積分規則怎么清除重新設定?\n' '請問 積分 規則 清除 設定' '可以設定積分使用的時間限制嗎?\n' '設定 積分 使用 時間' 0.21553238040152356)
其實有一句很相似:兩個門店積分規則是在總賬號設置還是在各自的門店后臺設置?
但是這局太長了,要看句法分析能不能把重要的信息提出來
===
'要如何取消會員價這個功能\n' '取消 會員 價 功能' '要如何取消會員價這個功能\n' '取消 會員 價 功能' 1.0)
('要如何取消會員價這個功能\n' '取消 會員 價 功能' '怎么設置多等級會員價?\n' '設置 等級 會員 價' 0.24836331314084664)
('要如何取消會員價這個功能\n' '取消 會員 價 功能' '全部修改價格,也要去會員價那里一起修改?\n' '修改 價格 會員 價 修改' 0.2418506308247461)
('要如何取消會員價這個功能\n' '取消 會員 價 功能' '怎么沒有前臺多級會員價?\n' '前臺 多級 會員 價' 0.23964391713624741)
('要如何取消會員價這個功能\n' '取消 會員 價 功能' '?\n' '' 0.23468218499079632)
想起來一個方法,可不可以手動把會員價弄成會員 價,這樣就有兩個相似,相似度會更高。 自定義詞典
===
('自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' '自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' 1.0)
('自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' '自助點餐怎么取消外賣功能?\n' '自助點餐 取消 外賣 功能' 0.23438866398780467)
('自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' '你們對接外賣嗎?怎么對接?\n' '對接 外賣 對接' 0.2163044592979913)
('自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' '外賣對接你們能直接處理么?\n' '外賣 對接' 0.2163044592979913)
('自助點餐能只做堂食不做外賣嗎?\n' '自助點餐 做 堂食 做 外賣' '?\n' '' 0.213404445407943)
匹配的還不錯
===
('自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' '自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' 1.0)
('自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' '?\n' '' 0.21883482808063648)
('自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' '怎么估清?\n' '估清' 0.20377429889279378)
('自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' '會員可以自助充值嗎?\n' '會員 自助 充值' 0.2027382510166508)
('自助點餐和你們的電子廚顯,是怎么賣的呢?\n' '自助點餐 電子 廚顯 賣' '我怎么對賬?\n' '對賬' 0.20238741883311298)
自定義,電子廚顯
===
自定義
自提
===
積分 加入詞典
?
轉載于:https://www.cnblogs.com/yjybupt/p/9942398.html
總結
- 上一篇: 多媒体教室与计算机教室区别,多媒体学习环
- 下一篇: Excel破解vba密码