众包数据库管理、时空众包、移动群智感知方向的综述整理——附思维导图
眾包數據庫管理、時空眾包、移動群智感知方向的綜述整理——附思維導圖
- 論文介紹
- 眾包數據庫管理
- 時空眾包
- 移動群智感知
- 總結
論文介紹
該方向的發展主要分為三個模塊:時空眾包、群智感知、眾包數據庫管理;
然后我就選擇這個方向上其中一個具有代表性的團隊綜述進行分析:
- 眾包數據庫管理(李國良——清華大學、陳雷——香港科技大學);
- 時空眾包(童詠昕老師 北京航空航天大學);
- 移動群智感知(於志文 西北工業大學)
眾包數據庫管理
該章節內容及思維導圖整理的論文是出自柴成亮, 李國良, 趙天宇, 駱昱宇, 于明鶴. 眾包數據庫綜述. 計算機學報, 2018.
現如今,對于許多數據處理與分析的任務(例如實體匹配),僅僅依靠機器算法不能達到很好的效果。幸運的是,眾包(crowdsourcing)模式的出現在很大程度上解決了這一問題。眾包概念最初是由美國《連線》的記者JeffHoew在2006年提出的,其定義是:“一個公司或機構把過去由員工執行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)網絡大眾的做法”。也就是眾包利用人的智慧來幫助我們解決大型的、對于機器來說很難的問題。在過去的十年中,眾包模式已經不知不覺惠及到幾乎每一個人并成為數據挖掘和數據管理的一大研究熱點。一些影響力極其深遠的工程,例如維基百科,百度知道,百度百科還有學術界的ImageNet,都是通過眾包模式來構建的。步入大數據時代,數據量在不斷增大,數據的表現形式也越來越多樣化,導致眾包的需求量增大以及任務的形式增多,在線眾包平臺應運而生,例如亞馬遜的AmazonMechanicalTurk(AMT)、Crowdflower和Upwork。在這些平臺上,我們可以輕松地雇傭千上萬的工人(Worker)來幫助我們解決問題。解決問題的流程可以概括為以下三步:(1)任務發布者(Requester)發布許多任務到眾包平臺。(2)眾包平臺把任務分配給工人。(3)工人回答問題并返回答案給任務發布者。
然而,對于任務發布者來說與眾包平臺交互是比較不方便的,因為眾包平臺會要求任務發布者設置很多參數甚至書寫代碼來布置任務。為了解決這一問題,受傳統數據庫管理系統的思想啟發,研究人員們提出了眾包數據庫例如CrowdDB,Qurk,Deco和CDB。一方面,這些數據庫提供了描述性的編程接口,其允許任務發布者利用簡單的類SQL語言來發布任務并與眾包平臺交互。另一方面,眾包數據庫封裝了平臺與工人交互的復雜流程。針對不同的數據庫算子,眾包數據庫會自主選擇不同的策略來分配任務并推理答案。這樣大大提升了答案質量,降低了眾包開銷,也使得任務發布者不需要親自設計相關策略。在這種設計思想下,當任務發布者給出一個類SQL查詢,眾包數據庫首先解析這個查詢,生成帶有眾包算子的查詢計劃。接著根據計劃生成任務發布到眾包平臺上,最后收集眾包工人的答案并產生最終的結果。
眾包數據庫與傳統數據庫的不同主要有以下兩點。第一,傳統數據庫采用的是封閉環境(ClosedWorld)的模型。該模型僅能處理數據庫中已經存在的數據。然而眾包數據庫采用的是開放環境(OpenWorld),該模型可以利用人工來獲取外部世界的數據,加載到數據庫后再進行處理。例如,收集一條新的記錄或者填充一個屬性。第二,眾包數據庫可以利用人的智慧來處理數據庫相關算子。例如,比較兩個實體是不是指代同一實體,記錄之間的排序,為實體打分等等。
完整思維導圖資源(可以私信/評論,郵箱私發給您):
https://download.csdn.net/download/Fama_Q/14946029
時空眾包
該章節內容及思維導圖整理的論文是出自童詠昕, 袁野, 成雨蓉, 陳雷, 王國仁. (2017). 時空眾包數據管理技術研究綜述. Journal of Software, 28(1).
隨著移動互聯網技術與共享經濟模式的快速發展,移動計算技術為眾包數據管理帶來了更多的外延需求,其不僅延伸了眾包數據管理系統所需管理數據的類型,更延伸了眾包數據管理系統可獲取數據的方式。所謂延伸所需管理數據的類型是指:由于移動設備自身攜帶著大量時空數據,且此類時空數據又與眾包任務和眾包參與者(也稱為“眾包工人”)的行為密切相關,眾包數據管理系統不得不考慮如何有效地處理此類新型數據問題.例如,近年來全球流行的各類實時專車類服務平臺,如滴滴出行、神州專車與Uber等,均采用時空眾包方式提供服務,其中,專車用戶為眾包任務請求者,專車司機即眾包參與者.所謂延伸可獲取數據的方式是指:移動設備日益強大的功能產生了一類以獲取數據為目標的新型眾包任務.例如,美國的Gigwalk公司[23]組織眾包參與者通過智能手機收集不同超市的物品價格,而國內高德地圖公司推出的“道路尋寶”服務也旨在組織眾包參與者收集國內各大城市的道路周邊信息。
綜上所述,移動互聯網與物聯網等技術的飛速發展,使得眾包數據管理技術從基于在線眾包平臺的模式轉變為一種新型的服務模式,稱為“時空眾包(spatiotemporalcrowdsourcing)”(也稱為空間眾包或移動眾包)。簡言之,時空眾包數據管理技術是指以時空數據管理平臺為基礎,將具有時空特性的眾包任務分配給非特定的眾包參與者群體為核心操作,要求眾包參與者以主動或被動的方式來完成眾包任務并滿足任務所指定時空約束條件的一種新型眾包計算模式。特別地,當前“互聯網+”時代的共享經濟模式為時空眾包數據管理技術提供了大量實際應用。具體而言,近年來流行的各類O2O(online-to-offline)應用、災情監控、交通管理、公共安全、物流管理和社交媒體等領域,都有意或無意地采用了時空眾包技術以提高其服務質量。因此,時空眾包數據管理技術已遍及百姓衣食住行等各個領域,并在人們日常生活中扮演著越來越重要的角色。
不同于其他眾包技術綜述類文章,本文僅聚焦于時空眾包數據管理技術,首先揭示時空眾包與傳統眾包技術的區別與聯系,隨后以時空眾包平臺的工作流程與其任務特點為基礎深入討論了當前時空眾包數據管理的3項核心研究問題和3類應用技術的研究現狀,同時也展望了時空眾包數據管理領域未來潛在的研究方向,為相關研究人員提供有價值的參考。
完整思維導圖資源(可以私信/評論,郵箱私發給您):
https://download.csdn.net/download/Fama_Q/14946036
移動群智感知
該章節內容及思維導圖整理的內容是出自京東聯合實驗室“城市計算夏令營”上於志文老師的演講分享。
收集“城市大數據”則是開展城市計算研究的基石。基于靜態設施的傳統感知技術(典型代表為物聯網)存在部署成本高、覆蓋范圍有限等不足,難以滿足城市空間大規模動態感知需求。以群智感知(Crowd Sensing)、無線感知(Wireless Sensing)等為代表的新型感知技術成為應對公共安全、災難應急等重大挑戰的有效方式,受到國內外學術界和工業界的廣泛關注。群智感知利用廣泛存在的智能設備(智能手機、可穿戴設備、車載設備等),實現靈活機動且成本低廉的數據收集。移動群智感知(Mobile Crowd Sensing)是群智感知的一種特殊形式,其以大量普通用戶及攜帶的智能設備作為感知節點,利用大眾的廣泛分布性、靈活移動性和機會連接性實現大規模時空感知。相比群智感知,移動群智感知覆蓋范圍更廣、靈活性更強,是一種“以人為中心”的感知模式,通過利用顯式或隱式的大眾“智慧”(即群體智能),對低質、冗余、碎片化感知數據進行優選和增強理解,進而為城市計算提供更加優質的數據。移動群智感知關注的主要科學問題是:1)如何合理選擇和協同泛在、互補的群體感知能力實現高質量感知;2)如何高效處理和融合低質、冗余的群體感知數據實現準確理解。
移動群智感知結合移動群智感知關鍵科學問題,重點在感知任務分配、感知數據匯聚、群智融合計算等方面開展研究工作。
完整思維導圖資源(可以私信/評論,郵箱私發給您):
https://download.csdn.net/download/Fama_Q/14946033
總結
這里整理的只是本人自己在平時閱讀眾包方向論文時遇到的具有代表性的大牛團隊及自己所感興趣的方向,這些都是國內的一些研究學者團隊,當然在眾包方向上國外的一些團隊也很強例如:Vincent Lenders.Princeton University,USA. ; Atsuyuki Morishima.University of Tsukuba,Japan.
新的一年要快樂,加油吖 ( ^ _ ^ ) !
總結
以上是生活随笔為你收集整理的众包数据库管理、时空众包、移动群智感知方向的综述整理——附思维导图的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 常用计算机病毒表及其专杀工具,维金病毒-
- 下一篇: c语言编程队名,比赛团队队名及口号