您當前的位置 : 東北網  >  東北網法制  >  法治聚焦  >  新聞
搜 索
揭秘中國民間最大打假隊 10億商品中撈假貨
2017-03-21 10:20:26 來源:新華社客戶端  作者:王元元
關注東北網
微博
Qzone

   10億商品中撈假貨

  『線上打假的難點在於商品數量龐大,單淘寶上就有數以十億計的商品,要從如此海量的商品中找出假貨,難度可想而知。』清海說,阿裡巴巴最終選擇了自己最為拿手的大數據作為切口。

  所謂『大數據打假』,就是利用智能識別、數據抓取與交叉分析、智能追蹤等技術手段,通過一個涵蓋多重考量因素和線上規則的實時大數據模型將假貨從龐大的在線商品中篩選出來。

  從2013年起,阿裡巴巴就逐步建立起了全球最專業的圖片侵權假貨識別系統,通過檢測圖片中的局部Logo,來識別圖片中商品的品牌,進而判斷該商品是否為假貨,識別能力超過國外同類圖片偵測軟件Google goggles。

  但這只是依靠單一因素的初級大數據打假形式。

  『我們希望構建一個更為豐富的數據模型。』清海告訴本刊記者。

  為此,其所在的團隊開始著重研究售假賣家和正規賣家的行為軌跡,找到兩者的差異,進而建立一個面向全平臺賣家的評價模型。

  這個在龐大的商品信息、物流信息、支付信息基礎上搭建的評價模型包含了100多項對賣家的考量因素,如登陸IP、商品文字、圖片描述、交易信息、消費者評價、權利人投訴等,甚至一些社交媒體數據也會被納入其中。

  借助速度可達每秒1億次的評價模型,清海所在的團隊能實時對全網的十億在線商品進行篩查,對淘寶數百萬賣家進行評分,以識別出具有售假風險的高危用戶和售假團伙。

  起初,該體系幫助阿裡巴巴揪出了不少潛伏已久的售假賣家,但在運營九個月後,這個被稱作『大而全』的萬能評價模型就暴露出了問題。

  『篩選出的部分信息最終被證實是虛假的,也就是店鋪並未涉假,盡管這種信息在所有推送信息中佔比不足1%,但仍然說明原先的萬能評價體系存在缺陷,覆蓋率很高,准確性有問題。』清海說。

  團隊不久便找到了問題的癥結:阿裡巴巴平臺上存在上百個類目的商品,每個行業的售假特征並不相同,統一的評價體系導致了誤判。

  之後,大數據模型建設團隊對該體系進行了昇級,將原本統一的評價模型拆分成針對不同行業的多維評價模型,比如保健品行業、奢侈品行業等。

  『除保留一些固定的通用評價因素外,我們還根據每個行業的不同特征加入了特定的考量因素。』清海說,相較1.0版本,2.0版本的評價體系雖然覆蓋范圍小,但被證明准確率更高。

  得益於大數據打假的應用,阿裡巴巴目前已實現了『線上追蹤』、『線下定位』、『權利人共建』『24小時全年無休』的四維打假模式。

  結束白天的課程和訓練,夜間阿裡巴巴打假特戰隊員還得學習『大數據』打假相關知識,我中掌握假貨的線下分布規律十分重要,根據阿裡打假的成功來看,目前國內假貨的產業聚集區,主要在東部和東南沿海地區">結束白天的課程和訓練,夜間阿裡巴巴打假特戰隊員還得學習『大數據』打假相關知識,其中掌握假貨的線下分布規律十分重要,根據阿裡打假的成果來看,目前國內假貨的產業聚集區,主要在東部和東南沿海地區

首頁  上一頁  [1]  [2]  [3]  [4]  [5]  下一頁  尾頁

責任編輯:焦志明