数云融合丨知识图谱在烟草零售数字化转型中的应用
一、知識圖譜的趨勢? ?? ?
隨著互聯網、云計算、大數據、人工智能等信息數據技術的快速發展,計算機的智能化程度也越來越高,知識圖譜作為人工智能的核心技術,其在數據集成、語義表示和邏輯推理等方面存在著得天獨厚的優勢。
2021年,知識圖譜核心市場規模預計達到107億元,而到2026年,相應規模將超過296億元(《2022年中國知識圖譜行業研究報告》。感知到認知的跨越式發展,須引入發展認知技術,知識圖譜在此形勢下成為了破局的關鍵技術。
經過多年的發展,知識圖譜的技術已經深入到互聯網、醫療、金融等多個行業,其應用場景也包含了智能推薦、業務推理、運營分析、服務測評、決策支持、RPA機器人與大數據挖掘。
二、什么是知識圖譜?? ?
知識圖譜是人工智能的一大底層技術,是描繪實體之間關系的語義網絡,自帶語義、邏輯含義和規則,通過三元組即“實體×關系×屬性”集合的形式來描述事物之間的關系。
知識圖譜將非線性世界中的知識信息結構化、可視化,輔助人類進行推理、預判、歸類。
知識圖譜中的圖并非圖像概念,而是類似化學分子式的結構,一個知識圖譜往往存在多種類型的實體與關系。
知識結構網絡化、網絡結構復雜、網絡由三元組構成、數據主要由知識庫承載是知識圖譜的四大基本特征。一般而言,知識圖譜的數據以文本化數據為主,數據化數據為輔。
三、煙草零售行業的痛點?? ??
煙草商業企業作為煙草產業鏈上重要一環,外部連接煙草工業企業、零售客戶、消費者,內部包含營銷、專賣、煙葉、物流等諸多業務,信息系統眾多,企業數據量龐大。
特別是當前卷煙營銷工作出現了新的特點,卷煙營銷模式、方法和手段也在不斷發生變化,面對“客戶需求多元化、客戶體驗個性化、行業特征高度適配化”的數字化運營階段,如何借助知識圖譜技術,整合煙草商業企業諸多業務系統數據資源,探索建立一個適用于卷煙零售戶的服務策略體系。
為零售戶提供全面高效的服務,能真正解決零售戶的實際問題,同步提升煙草公司服務能力、密切客我關系、強化品牌培育、拉升卷煙結構、強化終端軟實力,提高客戶滿意度和忠誠度,是實現卷煙營銷以及整個行業高質量發展的重要環節。
四、知識圖譜??在煙草零售行業的具體應用???
# 1? ?煙草零售行業知識圖譜構建設計
- 設計思路?
在煙草零售行業,主要解決如何基于知識圖譜技術,利用煙草商業企業營銷、物流、專賣、內管、市管等內部業務系統以及零售終端等外部系統數據,在此基礎上建立零售客戶標簽體系,能全范圍,多視角的描述零售客戶。
利用大數據與數據可視化等相關技術,實現標簽計算、展示等全生命周期管理。在零售戶標簽體系之上,建立零售客戶的知識圖譜模型。
圍繞零售客戶終端屬性、規范經營、以及不同類型計算標簽(預警度、誠信度、配合度、成長度、規范度等)數據模型的生成。
實現基于以零售戶和卷煙為中心實體的信息檢索與推薦系統,最終形成煙草零售戶客戶服務策略的知識圖譜,充分展示零售客戶在基本屬性、業務關聯關系、用戶需求、自身價值、用戶營銷、用戶行為等各個業務層面的信息,支持精準營銷、客戶洞察、渠道優化、品牌提升、運營內控、監督管理等卷煙零售客戶服務的應用場景。
- 圖譜構建方式?
煙草零售行業圖譜的構建方式主要是選用自上而下的模式來建設零售客戶服務策略知識圖譜的方式。
通過將數據粒度從文檔級別降到數據級別,聚合大量知識,實現知識的快速響應和推理。
其基本組成單位是“實體-關系-實體”三元組,以及實體及其相關屬性的鍵值對,實體通過之間的關系相互聯結。
從原始數據到知識圖譜的生成,大致要經歷知識抽取、知識融合、數據模型構建等過程。具體包括四個步驟:知識抽取、知識融合、知識加工、圖譜應用,如下圖所示:
/? ?圖:應用數據架構知識圖譜模型
知識圖譜的構建與計算,需要考慮以下內容:
1)? 不僅需要考慮如何結合文本、多媒體、半結構化、結構化知識、服務或API,以及時態知識等的統一知識表示,還需要進一步考慮如何結合結構化(如關系型數據庫)、半結構化(HTML 或 XML)和非結構化(文本、圖像等)多源異質數據源來分別構建通用事實類(各種領域相關實體知識)、常識類、零售客戶記憶類和服務任務類知識庫等;
2) 針對不同類型的數據和知識,有不同的構建技術,如針對結構化數據的知識映射、針對半結構化知識的包裝器(Wrapper),以及針對非結構化知識的文本挖掘和自然語言處理。
3) 為了得到融合的圖譜,除了需要考慮離線的多源異構的知識融合,還需要額外考慮服務任務類動態知識的對象綁定。這項工作往往是在線完成的,相當于根據不同的交互,在線動態擴充知識圖譜并實例化的過程。
4) 最后還需要考慮知識圖譜的存儲。既然有了知識,就必須用一定的手段去存儲。但這里談到的存儲,不僅僅是建立一個知識庫,還包括存儲之后的應用效率等。
- 標簽體系建立?
標簽體系內容可以從零售戶基礎信息、營銷、專賣、物流、規范經營、內管等多個領域中定義。
零售客戶標簽體系建立模式主要包括標簽定義、標簽規則、標簽計算和標簽查詢這4步。
標簽定義包括確認標簽在標簽管理體系中的分類、標簽名稱、標簽代號、標簽在同規則下的對應值、標簽狀態等。
標簽定義之后,需進一步明確標簽所對應的業務邏輯,標簽規則的設定即為標簽的業務邏輯配置過程。
標簽計算包含標簽計算任務的建立,以及標簽計算調度接口的實現。主要是對配置好的標簽規則按指定循環周期進行自動的程序調度管理,以確保標簽數據的正常使用。
標簽查詢是廣義的查詢,即只要通過技術手段獲悉了標簽的直接或間接分析結果,均為標簽查詢。
- 知識圖譜模型
利用自動化相關技術,將已有的業務系統數據(結構化)、離線文本、圖片等(非結構化)、以及運行日志等(半結構化)自動整合成對應的結構化數據,以便于后續的實體、關系、屬性的建模與維護。
譬如,以業務系統結構化數據為例,結合業務數據的關聯關系,將概念類類比成模式層,將數據之間的關聯關系映射到知識的關系。
·模型定義。模型定義包括模型的名稱,所屬類別等 信息。模型定義功能包含模型的在線維護,具體包含模型的增刪改查等。
·模型規則。模型定義之后,需進一步明確模型所對應的業務邏輯,即為模型的業務邏輯配置過程,確定標簽具體篩選出客戶的組合方式。
·模型規則主要支持以下幾種運算邏輯:四則運算、比較運算、邏輯運算、聚合運算、函數運算以及常量的引用。并支持在線配置模型規則,以應對不同模型計算場景。
·模型計算。模型計算主要是對配置好的模型規則按指定循環周期進行自動的程序調度管理,以確保模型數據的正常使用。包含模型計算任務的建立,以及模型計算調度接口的實現。
·模型查詢。模型數據的查詢主要是按照業務需求將零售客戶的模型輸出,提供實時接口查詢和批量卸載兩種方式。
# 2? ?知識圖譜系統架構?
綜上所述面向煙草零售戶客戶服務策略的知識圖譜建設的理論基礎,在系統架構設計上,可分為6個部分,數據獲取層、數據存儲層、數據組織層、數據計算層、數據管理層以及數據應用層。其設計如下圖所示:
/ 圖:知識圖譜系統架構示意圖
- 數據接入層
數據接入層,其主要目的是對接當前煙草商業系統中已有的業務數據,主要包含營銷、物流、專賣和內管數據。本部分數據以結構化數據為主,并且圍繞零售戶、卷煙兩大實體類型進行展開。
- 數據存儲層
數據存儲層,其主要功能是實現各業務系統原始數據的匯總存儲、加工后結果數據的存儲,包含知識圖譜數據的存儲。
其中基礎源數據直接以文件方式存儲到HDFS中,并結合 Hive 實現傳統數據倉庫的功能;而對于圖數據,則結合圖數據庫 Graph 與列數據庫 Hbase 實現數據存儲。
對于圖數據的索引,則使用基于 Lucene 的搜素引擎 Elasticsearch。該搜索引擎是一種基于全文搜索的分布式搜索引擎,從而保證數據的高效檢索。
- 數據組織層
數據組織層,其主要功能是實現數據的預處理、裝載與實體對齊等操作。數據預處理主要包含命名實體識別、實體特征向量的提取以及實體向量化表示等操作。
當然針對煙草知識圖譜中節點相似度的計算,亦屬于數據預處理的范疇。
- 數據計算層
數據計算層是數據組織層的擴展與延續。其主要目的是實現數據的深度分析與計算。
包含批量離線數據的計算以及即時數據的計算,而計算的工具,則使用基于內存的分布式計算引擎——Spark。?
- 數據管理層
數據管理層則側重數據的權限管理與調度管理等。重點權限的設置與數據API 的管理等。
通過數據權限配置,可規范數據輸出的內容。
通過調度配置可配置自動生成數據、處理數據的調度任務,從而實現程序的自動化運行。?
- 數據管應用層
數據應用層主要用于零售戶與卷煙信息的檢索,實體關系展示,圖譜展示等功能,是本系統中人機交互的重要部分。而對于專業人士來說,本部分可提供本體管理、知識維護等模塊。
# 3? ?知識圖譜應用?
面向煙草零售客戶服務策略的知識圖譜建立之后,可以廣泛的應用于煙草商業企業中,為零售戶提供全面高效的服務,能真正解決零售戶的實際問題,同步提升煙草公司服務能力、密切客我關系、強化品牌培育、拉升卷煙結構、強化終端軟實力,配套終端硬件建設,助力卷煙市場大戶管理、貨源精準投放等工作。
/ 圖:零售客戶與卷煙知識圖譜示意圖
- 卷煙商品推薦
基于零售客戶服務策略知識圖譜的建立,構建基于零售戶和卷煙的檢索與推薦系統,可以獲取3類卷煙商品數據與零售客戶的關系。
·強關聯卷煙商品:按照零售客戶和卷煙品牌知識圖譜的相似度關系,相似度值最高的卷煙商品定義為強關聯卷煙商品。
·弱關聯卷煙商品:按照零售客戶和卷煙品牌知識圖譜的聚類結果,與推薦目標用戶相似度較高用戶聚類的卷煙商品,且這些卷煙商品與目標用戶關聯度較低的商品定義為弱關聯卷煙商品。
·無關聯卷煙商品:按照零售客戶和卷煙品牌知識圖譜的聚類結果,被聚類次數較高的卷煙商品但與目標用戶沒有關聯關系的商品為無關聯卷煙商品。
- 零售客戶經營指導
通過對知識圖譜技術的應用,以實現“簡化、協調、高效”為指導原則,通過梳理一線營銷人員日常工作,減少重復、非必要工作內容及流程,從工作協同、效率提升、價值增值等方面創新客服經理工作方法,改善客戶經理工作服務流程,線上服務和線下服務相結合,依托面向煙草零售客戶服務策略的知識圖譜,提升客戶服務的滿意度,做好現代終端建設的服務和保障工作。
五、結束語??
本文探討了基于知識圖譜技術,利用煙草商業企業營銷、物流、專賣、內管、市管等內部業務系統以及零售終端等外部系統數據,建立零售客戶與卷煙的數據標簽體系,設計了面向煙草零售客戶服務策略的知識圖譜系統。
通過機器學習算法進行回歸、分類、聚類,再結合卷煙營銷工作中客戶服務的真實場景以及實際需求,為后續的智能化應用,如智能搜索、自動問答、推薦和決策支持等奠定基礎。
總結
以上是生活随笔為你收集整理的数云融合丨知识图谱在烟草零售数字化转型中的应用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: c语言出错英语显示怎么看,C语言程序设计
- 下一篇: TencentOS Server编译安装