阿里妈妈是如何做品牌风险管理的
歡迎關(guān)注:阿里媽媽技術(shù)公眾號
本文作者:阿里媽媽風(fēng)控團(tuán)隊
?
品牌風(fēng)險管理是阿里媽媽風(fēng)險管理中最核心的風(fēng)險之一,一直備受商家和消費者關(guān)注。商家在沒有品牌資質(zhì)的情況下售賣假冒或山寨的品牌商品,會侵犯品牌商及消費者的權(quán)益。本文將主要介紹,阿里媽媽品牌風(fēng)險識別體系是如何一步步煉成的。
一、背景
1.1阿里媽媽品牌風(fēng)險簡介
在阿里媽媽業(yè)務(wù)中,鑒別品牌風(fēng)險的第一步是識別出商品相關(guān)的品牌,第二步是結(jié)合商品的資質(zhì)去判斷是否屬于品牌風(fēng)險。本文重點關(guān)注圖像中的品牌識別。
假貨和山寨問題在業(yè)務(wù)上的定義包括:
-
涉嫌假冒商品:能判斷是明顯假貨的商品(如低價)
-
涉嫌品牌侵權(quán):出現(xiàn)明確的商標(biāo)信息(注冊商標(biāo)或品牌中文或英文文字信息)
-
圖片遮蓋涂抹:存在針對商標(biāo)信息的惡意遮蓋涂抹
-
發(fā)布混淆信息(品牌山寨):在商品外觀或商標(biāo)上仿大牌,讓消費者認(rèn)為該商品為某知名品牌商品(主要為國際知名品牌)
左圖正品 右圖假貨
左圖正品 右圖山寨
鑒別品牌風(fēng)險第一步是識別出商品相關(guān)的品牌,第二步是結(jié)合商品的資質(zhì)去判斷是否屬于品牌風(fēng)險。所以阿里媽媽品牌風(fēng)險識別的核心是品牌識別問題。本文重點關(guān)注圖像中的品牌識別。
1.2難點與貢獻(xiàn)
基于以上背景,我們著手研究品牌識別的整體方案。在提解決方案之前,我們先看一下品牌識別問題的難點。
1.2.1難點
1)數(shù)據(jù)多樣性(品類、展現(xiàn)形式、角度和遮擋等)。
2)品牌特征的多樣性(以下都是adidas鞋的特征)。
3)部分?jǐn)?shù)據(jù)沒有l(wèi)ogo或者logo很小。
4)山寨款式變化多樣。
5)品牌規(guī)模大。
6)違規(guī)商品在總商品中占比極小,非對稱(正常商品量遠(yuǎn)大于問題商品量)的場景下,做到高精度和高召回較難。
7)廣告場景下對抗激烈,不僅體現(xiàn)在圖片上的對抗,還有商品本身的對抗。比如下圖一山寨商品買回去可以自己把nike上面多余的一塊拆掉,最后一張圖看著像匡威,但實際上框里面的文字不是converse。
1.2.2貢獻(xiàn)
針對以上問題,我們提出了品牌分類模型+品牌logo檢測模型+品牌圖像變異識別模型的綜合方案,另外我們構(gòu)建了大規(guī)模的品牌數(shù)據(jù)集,為我們識別能力的構(gòu)建打下了堅實的基礎(chǔ)。
1)品牌分類模型
我們將分類模型應(yīng)用在品牌識別問題上,驗證了分類模型可對局部的小logo或者特征進(jìn)行識別,取得了不錯的效果。
-
一方面,分類模型中每一類可容納不同的特征類型,只要每一種特征類型相應(yīng)的數(shù)據(jù)量足夠,就不容易被當(dāng)成噪聲。我們將同一個品牌所有數(shù)據(jù)當(dāng)成一類,既解決了數(shù)據(jù)和品牌特征多樣性的問題,又大大降低了數(shù)據(jù)構(gòu)造的難度。
-
分類模型不光識別logo,也可以識別款式等非logo特征,解決了基于logo檢測的模型無法識別品牌款式的問題,拓展了品牌識別的范圍。
-
分類模型計算圖片屬于每個品牌的置信度,山寨款式天然更像對應(yīng)的仿的品牌,所以分類模型天然可以召回山寨款式。
-
分類模型的資源損耗和品牌規(guī)模無關(guān),10個品牌和100個品牌的計算開銷和速度差別不大,經(jīng)過加速后單臺G41可以達(dá)到4000 qps,資源開銷不再是瓶頸。
2)品牌logo檢測模型
雖然分類模型有以上優(yōu)點,但也有一個比較大的局限性,即分類模型會依賴上下文信息,也就是除了受品牌特征本身影響,也會受商品本身的外觀、排列以及背景的影響。比如一雙椰子鞋放在一個和正常展示的數(shù)據(jù)差異非常大的背景中,有可能識別不了,故分類模型容易受到對抗攻擊。 檢測模型將品牌識別的范圍縮小到logo區(qū)域,logo的區(qū)域不像全圖的背景容易發(fā)生變化,一般處于商品上或者背景的某個局部上,特征更加穩(wěn)定,受對抗攻擊的影響較小,可以作為一個穩(wěn)定的識別能力。
3)品牌變異圖識別模型
業(yè)務(wù)上高發(fā)變異為圖片拼接和商品堆砌(如下圖)。拼接和堆砌的圖片中商品主體過小,特征不明顯,且高發(fā)的一些大牌款式違規(guī)并不存在logo,分類和檢測模型都可能束手無策。不過這些圖片從視覺上看有一定的規(guī)律,我們不直接識別品牌本身,而是去從側(cè)面去召回有這些排列規(guī)律且視覺上比較接近的圖片,作為一種補(bǔ)充召回手段。
4)品牌數(shù)據(jù)集
我們堅信數(shù)據(jù)是識別能力的基礎(chǔ)和保障,需要用更加豐富的數(shù)據(jù)來提升模型的泛化能力,數(shù)據(jù)是知識,知識不夠的時候很難做出準(zhǔn)確的判斷。當(dāng)然數(shù)據(jù)的多樣性是無窮的,我們不可能全部獲取,而是在可控代價下盡可能獲取更豐富有代表性的數(shù)據(jù)。 當(dāng)前我們構(gòu)建了品牌的分類和檢測數(shù)據(jù)集(本文我們使用其中212個品牌數(shù)據(jù)做實驗),同時配合一份品牌特征識別點的領(lǐng)域知識數(shù)據(jù)。
5)各個模型之間的協(xié)同
二、數(shù)據(jù)集
這里包含了品牌識別特征點、品牌分類數(shù)據(jù)集、品牌logo檢測數(shù)據(jù)集、品牌算法評價方案。數(shù)據(jù)集是品牌識別模型構(gòu)建的基礎(chǔ),本質(zhì)上給模型提供了相對豐富的領(lǐng)域知識。
2.1品牌特征定義
品牌特征的定義實際上是為了給出一個標(biāo)準(zhǔn),數(shù)據(jù)集的建設(shè)必須有標(biāo)準(zhǔn),這樣才能可參考可衡量。不同于ImagNet數(shù)據(jù)集中的自然類別比較通用,品牌類別的判斷是一個有很強(qiáng)的領(lǐng)域知識的問題,以奢侈品牌GUCCI為例,下面圖片中的商品都是GUCCI的商品,紅色框框出來的是品牌特征識別點:
通過這上面的例子可以看到品牌特征的豐富性,尤其是大牌和奢侈品,他們有能力不斷推出自己的設(shè)計和元素。阿里媽媽運(yùn)營同學(xué)在這塊有較深的積累,整理出了這份品牌特征。 有了這份品牌特征之后,外包標(biāo)注就有可行性了,大家參照同一個標(biāo)準(zhǔn),有據(jù)可查。但是實際標(biāo)注的時候依然會遇到很多問題:
-
大眾款式的判定
某一些品牌的款式比較大眾,或者被山寨之后比較大眾,大眾款式不適合被處罰,但是大眾款式的判斷沒有一個統(tǒng)一的標(biāo)準(zhǔn)。下面這幾個是大眾款式,從左到右分別是仿匡威、周仰杰、crocs:
-
山寨的判定
比如下面這些channel哪些該算品牌侵權(quán)或山寨,哪些不該算,尺度很難把握。
-
品牌特征的可識別性
有些品牌的logo非常小,到底多大的logo具備可識別性,這個也需要作出判斷。
類似的問題還有很多,我們會結(jié)合業(yè)務(wù)和算法能力去綜合判斷并在和外包交互的過程中逐步細(xì)化沉淀標(biāo)準(zhǔn)和案例庫。
2.2分類數(shù)據(jù)集
-
關(guān)于類別構(gòu)造
我們將每個品牌的所有數(shù)據(jù)歸為一類,包括所有的品類、特征點、款式。分類模型有能力在一類中容納所有典型特征,只要相關(guān)特征的樣本沒有因太少而被淹沒。同時對業(yè)務(wù)應(yīng)用而言,資質(zhì)只和品牌相關(guān),判斷是侵權(quán)或山寨只需要識別品牌結(jié)果,無需細(xì)分到具體的款式。這種類別構(gòu)造方式大大降低了數(shù)據(jù)集建設(shè)的復(fù)雜度,一方面類別的數(shù)量大大降低,另一方面無需具體去控制每一種細(xì)分特征的數(shù)據(jù)量。
-
關(guān)于數(shù)據(jù)分布,接近線上真實分布
品牌類別中的數(shù)據(jù)分布對于模型的學(xué)習(xí)比較關(guān)鍵。我們把握一個基本原則,盡量靠近線上真實的分布,這樣業(yè)務(wù)上出現(xiàn)的多的數(shù)據(jù)能得到更多的重視,也符合業(yè)務(wù)管控的天然訴求,同時將數(shù)據(jù)獲取的問題簡化,無需花大量的精力去干預(yù)數(shù)據(jù)內(nèi)部的分布。
-
關(guān)于標(biāo)注數(shù)據(jù)的獲取
首先,淘寶基礎(chǔ)商品表里有部分?jǐn)?shù)據(jù)有品牌相關(guān)信息,這部分?jǐn)?shù)據(jù)作為重要的初始數(shù)據(jù)來源;其次是業(yè)務(wù)處罰數(shù)據(jù),作為重要的補(bǔ)充來源;第三是評論圖,可以提升樣本多樣性。 還有一些特定的重要款式無法通過品牌信息去大量獲取。關(guān)于重要款式,阿里媽媽運(yùn)營有比較強(qiáng)的領(lǐng)域知識,提供了很多搜索關(guān)鍵詞去定向獲取,如下圖是adidas重點款式的搜索關(guān)鍵詞:
此外,旗艦店也是我們獲取樣本的來源之一。
2.3檢測數(shù)據(jù)集
檢測數(shù)據(jù)集的構(gòu)建相對簡單,我們在分類數(shù)據(jù)集的基礎(chǔ)上抽樣數(shù)據(jù)進(jìn)行標(biāo)注。不同于分類數(shù)據(jù),檢測數(shù)據(jù)更加注重侵權(quán)的業(yè)務(wù),所以檢測數(shù)據(jù)集中品牌特征的定義為品牌注冊的商標(biāo)或者品牌名,一個品牌也會有多個商標(biāo)和多種不同的展現(xiàn)形式。如下圖分別是森海塞爾和立白會在圖片中出現(xiàn)的形式:
為了簡化標(biāo)注,一張圖只標(biāo)注一個品牌的檢測框,檢測框為標(biāo)準(zhǔn)矩形,無傾斜角,另外針對一個品牌有多種logo的情況,我們?yōu)榱撕喕矊⑦@些不同的logo當(dāng)成一類(在前期我們也驗證了檢測模型可以處理單類有多種logo的情況),可能會有一定的性能損失,但大大簡化了數(shù)據(jù)集構(gòu)建的難度。標(biāo)注樣例如下:
2.4算法評價
由于任務(wù)是品牌識別,只要給出識別的品牌即可,無需具體logo的位置,所以檢測和分類共用一份數(shù)據(jù)集。整體的評價方案是閉集評測集測召回(考察整體品牌召回能力),開集評測集測召回數(shù)據(jù)比例(關(guān)系到審核的開銷),業(yè)務(wù)評測集評價在業(yè)務(wù)數(shù)據(jù)上的表現(xiàn)(考察在歷史漏出數(shù)據(jù)上的表現(xiàn))。
2.4.1閉集評測集測召回
-
數(shù)據(jù)集情況
212個品牌,總共180605條數(shù)據(jù),平均每個品牌852條數(shù)據(jù),準(zhǔn)確率97%以上,每個品牌的數(shù)據(jù)包含對應(yīng)品牌的關(guān)鍵特征,關(guān)鍵特征包含了品牌logo、特定品牌款式、特定設(shè)計、品牌名稱等,每個品牌也可能包含多個類目的數(shù)據(jù)。
-
評價指標(biāo)
?
2.4.2開集評測集測召回比例
-
數(shù)據(jù)集情況
線上隨機(jī)抽取500萬數(shù)據(jù)。算法召回的比例決定了審核的量級,在實際應(yīng)用的時候比較重要。
-
評價指標(biāo)
召回比例=模型召回疑似品牌數(shù)據(jù)量/模型計算數(shù)據(jù)量
2.4.3業(yè)務(wù)評測集評價在業(yè)務(wù)數(shù)據(jù)上的表現(xiàn)
-
數(shù)據(jù)集情況
獲取品牌模型上線之后歷史大盤、專項評測和投訴獲取到的知識產(chǎn)權(quán)風(fēng)險數(shù)據(jù),共1449條,其中966條包含logo。標(biāo)注所屬品牌名以及是否有品牌logo,用于評測新模型在歷史遺漏數(shù)據(jù)上的效能提升。
-
評價指標(biāo)
召回率=召回品牌數(shù)據(jù)/總品牌數(shù)據(jù)
三、品牌分類算法
我們將分類模型應(yīng)用在品牌識別問題上,解決品牌款式、品牌山寨、品牌logo等的識別問題,同時解決性能的瓶頸問題。 之前我們在非對稱風(fēng)險識別問題上(如色情識別)用分類模型進(jìn)行了一定的實踐,分類模型可以識別細(xì)節(jié)的、局部的色情特征,所以我們推測分類模型也可以識別局部的品牌特征,基于這個認(rèn)知我們進(jìn)行嘗試。
3.1可行性研究
3.1.1 Nike品牌識別
我們選取nike品牌來最小代價驗證品牌分類模型識別的可行性,Nike品牌包含了圖形和文字兩種模式,模式相對固定,在部分圖片上logo會非常小:
選取nike品牌下的1萬樣本作為正樣本,隨機(jī)選1萬樣本作為負(fù)樣本,學(xué)習(xí)二分類模型,利用下圖中的快速冷啟動方法迭代多輪(核心是不斷挖掘難負(fù)樣本,學(xué)到好的分類邊界):
全網(wǎng)nike樣本庫107萬,用來測召回,線上隨機(jī)取100萬數(shù)據(jù)測召回比例和業(yè)務(wù)精度,標(biāo)注后結(jié)果如下表格:
| >0.5 | 74.6% | 14% | 0.32% |
| >0.9 | 60.9% | 41.2% | 0.095% |
| >0.99 | 46% | 68.7% | 0.038% |
這里有一個發(fā)現(xiàn),60.9%的有效召回集中在0.095%的數(shù)據(jù)里面,而另外的2.25%的數(shù)據(jù)里面只有13.7%的有效召回,也就是大部分有效的品牌召回集中在高置信度部分。這個特性對我們在業(yè)務(wù)上的應(yīng)用有指導(dǎo)意義,可以通過犧牲少量的召回大幅減少審核比例。召回能力的絕對值和數(shù)據(jù)集的難度有關(guān)(實際的召回會比表中的召回更高,一方面是因為我們默認(rèn)某個品牌id下的圖片都屬于對應(yīng)品牌,實際上并不是;另一方面,上面的模型只迭代了精度,并沒有優(yōu)化召回)。基于以上結(jié)果,我們初步判斷分類模型有希望在較小的代價下召回較大部分的品牌風(fēng)險。
3.1.3 大規(guī)模品牌識別
品牌數(shù)量增加之后,我們把所有品牌數(shù)據(jù)當(dāng)成一類,非品牌數(shù)據(jù)當(dāng)成另外一類,整體進(jìn)行精度迭代,至于品牌之間的混淆,暫不考慮。 這里有一個比較重要的特性,迭代前期識別精度越低的品牌在后續(xù)精度優(yōu)化中受到更多的重視,因為我們整體隨機(jī)取badcase,精度差的品牌的badcase占比相對高。但是到后期不同品牌之間會有差異,有的品牌在業(yè)務(wù)中出現(xiàn)的比例高,在整體的召回中比例會高,但不代表精度差,有些品牌在業(yè)務(wù)中出現(xiàn)比例極低,雖然在整體召回比例中低,但是精度可能也比較差(不過好在召回比例低的那些品牌即使精度差對整體的工單量影響也不大,可以不必強(qiáng)求學(xué)到高精度),后期優(yōu)化的時候就需要有選擇性的加入迭代的badcase,本身精度已經(jīng)比較高的品牌不適宜繼續(xù)迭代,否則會犧牲召回,迭代的重點放在低精度的品牌上。 下面是訓(xùn)練過程中我們總結(jié)的幾個要點: 1)不同品牌負(fù)樣本的均衡 訓(xùn)練數(shù)據(jù)中負(fù)樣本(badcase樣本)的構(gòu)造比較重要,負(fù)樣本的總量和hard sample的比例決定了召回和精度的折中,屬于不同品牌的負(fù)樣本之間的比例決定了不同品牌的精度和召回的平衡,在負(fù)樣本總量不變的情況下增加A品牌的負(fù)樣本比例減少B品牌的負(fù)樣本比例會提升A的精度并降低A的召回同時降低B的精度并提升B的召回。所以要單方面調(diào)控部分品牌的精度和召回只能單獨增加或減少這部分品牌的負(fù)樣本數(shù)量,其他品牌的負(fù)樣本則不操作,也可以調(diào)控負(fù)樣本中困難樣本的比例來實現(xiàn)。 2)品牌規(guī)模對學(xué)習(xí)難度的影響 品牌規(guī)模大了之后數(shù)據(jù)量增加,訓(xùn)練的時間必然增長。而從訓(xùn)練的難度來看,實際上是減少了,舉個例子,當(dāng)品牌中只有一個鞋類品牌時,如何讓模型學(xué)到鞋子上的某個特征或logo,是要花較大的代價的,你需要告訴模型鞋子不是這個品牌的特征,即使長得像的鞋子也不是這個品牌的特征,而如果品牌中有大量鞋子類別時,模型天然就會關(guān)注到不同鞋子品牌差異的地方以及同一品牌鞋子共性的地方,難度自然降低。
3.2模型結(jié)果和優(yōu)化嘗試
基于上文中總結(jié)出的方案,我們在212個品牌數(shù)據(jù)集上訓(xùn)練得到base模型,在我們的評測集上結(jié)果如下:
閉集評測集:
| Base | 58.6% | 1% |
業(yè)務(wù)評測集(本身屬于漏召回的為主,整體效果會偏差):
| Base | 25.5% | 51.1% |
我們對正負(fù)樣本進(jìn)行提純優(yōu)化并引入審核業(yè)務(wù)數(shù)據(jù),得到優(yōu)化后的版本:
閉集評測集:
| Base | 58.6% | 1% |
| 優(yōu)化版 | 60.0% | 1.14% |
業(yè)務(wù)評測集:
| Base | 25.5% | 51.1% |
| 優(yōu)化版 | 45.8% | 62.5% |
優(yōu)化后的版本在業(yè)務(wù)評測集效果提升明顯,主要得益于審核業(yè)務(wù)數(shù)據(jù)的引入。不過分類模型平均召回率還有提升空間,主要受制于品牌問題本身的復(fù)雜度以及對低召回比例的要求,我們可以結(jié)合其他識別能力去綜合提升品牌的召回。
3.3結(jié)果可視化
我們通過品牌分類模型反推原始圖像中對最終結(jié)果貢獻(xiàn)大的部分,一些樣例如下(左邊原圖,中間能量圖,右邊合成圖):
可以看出,模型確實關(guān)注到了品牌特征區(qū)域,再次驗證了分類模型在品牌識別問題上的可行性。
四、品牌檢測算法
雖然分類模型有較好的性能且能識別款式和山寨,但是容易受背景變化以及展示變化等上下文信息的影響,對抗能力較弱,基于檢測的算法能減少背景的干擾,只關(guān)注品牌logo區(qū)域,能提供相對穩(wěn)定的品牌logo識別能力,我們實現(xiàn)了基于logo檢測的品牌識別算法。
4.1品牌logo檢測算法的實現(xiàn)
logo檢測有一些傳統(tǒng)的方法,比如基于sift特征或者h(yuǎn)aar特征。但是這類特征魯棒性不夠,對于具有非剛性變換,變異logo的圖片,識別效果較差。對于大品牌來說(如channel),會存在著各種樣式的logo,這個問題會更加突出。所以我們選擇基于CNN的目標(biāo)檢測算法來解決品牌logo檢測的問題。
4.1.1 基礎(chǔ)檢測模型構(gòu)建
現(xiàn)有的基于錨點框(anchor)的通用物體檢測算法,可以分為一步法(one-stage)和二步法(two-stage)兩類。一步法檢測器速度更快,效果次之(如SSD、yolo等);而二步法檢測器擁有更好的檢測效果,但算法耗時偏高(Faster R-CNN、Mask R-CNN等)。
考慮到廣告風(fēng)控場景日均億級別的流量規(guī)模,我們調(diào)研了業(yè)界主流的目標(biāo)檢測算法,綜合計算資源和算法性能的平衡,最終選擇了單步檢測器yolov3作為我們的base模型,并在此基礎(chǔ)上進(jìn)行算法的優(yōu)化和調(diào)整。如上圖所示,和其他主流算法相比較,如SSD、RetinaNet等,yolov3算法具有較好的速度與精度的平衡,且對小目標(biāo)的識別能力較強(qiáng)。 我們將標(biāo)注好的檢測數(shù)據(jù)集分成訓(xùn)練集和測試集,使用yolov3作為基礎(chǔ)檢測算法,經(jīng)過調(diào)參之后,模型在測試集上的最佳mAP為78.06%。
4.2檢測算法的優(yōu)化
基于所構(gòu)建的品牌logo檢測基礎(chǔ)模型,我們又對該算法進(jìn)行了一系列相關(guān)優(yōu)化,使其更加適用于品牌識別任務(wù)。主要包括:數(shù)據(jù)增強(qiáng)處理、損失函數(shù)設(shè)計和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化等。
4.2.1 數(shù)據(jù)增強(qiáng)處理
數(shù)據(jù)增強(qiáng)處理的優(yōu)化,是提升模型性能一個非常有效的途徑。我們在yolov3原有的圖像裁剪、隨機(jī)翻轉(zhuǎn)和顏色擾動的基礎(chǔ)上,添加了圖像隨機(jī)平移擾動、軟標(biāo)簽設(shè)計,并綜合引入yolov4和yolov5中提升算法性能極為有效的mix-up和mosaic數(shù)據(jù)增強(qiáng)算法。所生成的訓(xùn)練樣本示例如下圖所示。在提升了訓(xùn)練樣本豐富度基礎(chǔ)上,有效解決了小尺度logo的檢測問題,下圖是數(shù)據(jù)增強(qiáng)之后的訓(xùn)練樣本示例。
4.2.2 損失函數(shù)設(shè)計
目標(biāo)檢測算法的損失函數(shù),包含分類損失函數(shù)和窗口回歸損失函數(shù)兩部分。前者用于約束模型分類的更準(zhǔn),后者用于約束模型預(yù)測框定位更準(zhǔn)。 yolo系列算法選擇多類別的交叉熵?fù)p失函數(shù)作為模型的分類損失函數(shù),在通用目標(biāo)檢測任務(wù)中取得了較好的結(jié)果。但在品牌logo數(shù)據(jù)集中,由于logo數(shù)量普遍偏少,且logo稀疏的圖片占比極高,正負(fù)樣本失衡問題較為嚴(yán)重。因此我們引入了Focal Loss作為模型的分類損失函數(shù),并針對正樣本配置了一個較高的比值(0.7,默認(rèn)為0.25),以強(qiáng)化正樣本的權(quán)重。實驗中發(fā)現(xiàn),在品牌logo數(shù)據(jù)集中,該設(shè)計取得了較好的性能提升。 現(xiàn)有主流的窗口回歸損失函數(shù),可以分為兩大類,一類是基于坐標(biāo)距離回歸的損失函數(shù),如L2 Loss、smooth L1 Loss等;另一類為基于IoU回歸的損失函數(shù),如GIoU Loss、DIoU Loss等。實驗中發(fā)現(xiàn),在品牌logo數(shù)據(jù)集中,選擇DIoU Loss替代原有的smooth L1 Loss能有最佳的定位效果。
4.2.3 網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化
針對特征提取網(wǎng)絡(luò)的設(shè)計,原有yolov3算法使用Darknet53作為基礎(chǔ)網(wǎng)絡(luò),我們參考了yolov5的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化思路(SPPNet+CSPNet+Focus模塊),并針對檢測頭進(jìn)行了優(yōu)化處理。相較于yolov3,新模型在inference耗時減少52%基礎(chǔ)上(P100 gpu),mAP提升13.5%。無論算法的吞吐效率,還是算法性能,均有較大提升。
| yolov3 | 608 | 416 | 245M | 50ms | 78.06% |
| 新模型 | 640 | 640 | 44.5M | 24ms | 89.89% |
4.3檢測算法效果展示
五、變異風(fēng)險識別
主要是從側(cè)面去識別一些檢測和分類模型比較難以識別的風(fēng)險,作為一種補(bǔ)充手段,一些困難的變異case如下:
一開始我們嘗試直接去學(xué)習(xí)拼接和堆砌這種特征,發(fā)現(xiàn)召回的量級過大,線上100萬的數(shù)據(jù)召回了18萬疑似拼接和堆砌的樣本,下面是一些案例:
所以單純靠拼接和堆砌這種側(cè)面特征是不可行的,沒有區(qū)分度,我們必須引入違規(guī)商品本身的外觀特征,比如椰子鞋的樣子,首飾的樣子,這樣能排除掉大部分的無關(guān)樣本,最終版本模型可以在0.11%的召回比例下閉集召回率達(dá)到82.1%。
六、算法融合
我們嘗試了將圖片品牌分類模型和文本品牌識別模型進(jìn)行融合,以及圖片分類模型和檢測模型融合,看互補(bǔ)性,結(jié)果如下: 閉集評測集:
| 圖片Base分類模型 | 58.6% | 1% |
| 文本Base模型 | 83.0% | 3.20% |
| 圖片Base分類模型+文本Base模型 | 80.3% | 1.46% |
| 圖片檢測Base模型yoloV3 | 53.8% | 0.95% |
| 圖片Base分類模型+圖片檢測Base模型yoloV3 | 70.3% | <1.95% |
業(yè)務(wù)評測集(只有圖片,無法追溯標(biāo)題等信息,只看和檢測模型融合):
| 圖片base分類模型 | 51.1% |
| 圖片檢測Base模型yoloV3 | 41.4% |
| 圖片Base分類模型+圖片檢測Base模型yoloV3 | 66.6% |
文本和圖片分類模型有一定的互補(bǔ)性,業(yè)務(wù)上可以結(jié)合使用,文本模型在這里召回比較高的原因是這里的數(shù)據(jù)中文本大部分沒有變異,難度相對較小,實際在業(yè)務(wù)中文本上的對抗是非常強(qiáng)且低成本的。 檢測模型我們只用了yoloV3版本,主要是驗證互補(bǔ)性,結(jié)果表明檢測和分類模型也確實有一定的互補(bǔ)性,閉集評測集和業(yè)務(wù)評測集上都有10個點以上的提升。
七、總結(jié)與展望
我們致力于促進(jìn)更好的廣告生態(tài),保護(hù)消費者和商家的權(quán)益,這條路沒有止境。
品牌風(fēng)險識別是風(fēng)控團(tuán)隊的核心戰(zhàn)場之一,未來我們也將以下幾個方面持續(xù)投入不斷提升:
第一、持續(xù)拓展品牌識別的范圍,保護(hù)更多的商家;
第二、提升和品牌風(fēng)險主動對抗的能力,提供更好的安全感;
第三,通過半監(jiān)督和無監(jiān)督等方式,構(gòu)建更加完善的品牌識別體系。
總結(jié)
以上是生活随笔為你收集整理的阿里妈妈是如何做品牌风险管理的的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 康力电梯开门不关门 服务器显示开门键动作
- 下一篇: 你真的懂点击率(CTR)建模吗?