《大数据》2020年第3期目次摘要
點擊上方藍字關注我們
《大數據》
第6卷第3期 2020年5月
大數據2020年第3期
(點擊原文鏈接在官網閱讀完整文章)
目次
01 專題導讀:數據資產化探索
朱揚勇,陳貴海
02?數據資產化框架初探
葉雅珍,劉國華,朱揚勇
03?基于利潤最大化的數據資產價值評估模型
董祥千,郭 兵,沈 艷,段旭良,申云成,張 洪
04?基于區塊鏈的數據市場
汪靖偉,鄭臻哲,吳 帆,陳貴海
05?數據資產標準研究進展與建議
戴炳榮,閉珊珊,楊 琳,紀婷婷,陳 美
06?面向價值實現的數據資產管理體系構建
李雨霏,劉海燕,閆 樹
07 專題導讀:面向大數據處理的數據流計算技術
周傲英,?于戈
08?面向大數據處理的數據流編程模型和工具綜述
鄒驍鋒,陽王東,容學成,李肯立,李克勤
09?數據流計算模型及其在大數據處理中的應用
畢倪飛,丁光耀,陳啟航,徐 辰,周傲英
10?數據流計算環境下的集群資源管理技術
湯小春,符 瑩,丁 朝,毛安琪,李戰懷
11?分布式數據流計算系統的數據緩存技術綜述
袁旭初,付 國,畢繼澤,張巖峰,聶鐵錚,谷 峪,鮑玉斌,于 戈
12?數據流技術在 GPU和大數據處理中的應用
蘇華友,梅松竹,李榮春,竇 勇
摘要
專題:數據資產化探索
導讀
作者:朱揚勇,陳貴海
理查德?彼得斯于1974年就提出數據資產名詞了,但至今數據資產仍然無法計入會計報表,說明數據資產化的難度非常大。這也妨害了數據的流通和再生產。隨著大數據的興起,數據是數字經濟的關鍵要素這一觀點已被廣泛認識。十九屆四中全會特別提出,健全勞動、資本、土地、知識、技術、管理、數據等生產要素由市場評價貢獻、按貢獻決定招酬的機制。這一重要創新論述對數據資產化提出了緊迫的要求。數據資產化涉及法律、會計、技術、方法等多方面因素,本身就是一個大數據問題,需要從多種視角開展研究和實踐。本期專題以數據計量、定價模型等技術手段為切入點,著重探索數據資產化方法,包括數據資產化框架、評估模型、定價模型、標準等。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00001.shtml
數據資產化框架初探
作者:葉雅珍,劉國華,朱揚勇
摘要:隨著數字經濟的發展,將作為數字經濟關鍵要素的數據看作一類新型資產已經獲得共識。但是,并不是所有數據都可以作為資產。因此,哪些數據可以作為數據資產、作為數據資產的數據應該具備什么條件、如何將一個數據集轉化為數據資產是當前數據產業、數字經濟亟須解決的問題。研究了數據資產的特點和需具備的條件,提出了一個數據資產化基本框架,包括數據資源確權、數據價值確認與質量管控、數據裝盒入庫、貨幣計價與評估、數據資產折舊和增值的管理5個步驟,為數據資源的資產化提供了一條可行的路徑。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00003.shtml
基于利潤最大化的數據資產價值評估模型
作者:董祥千,郭 兵,沈 艷,段旭良,申云成,張 洪
摘要:“數據是有價值的,并將成為一種經濟商品”的理念已成為共識,然而數據的非競爭性使數據價值有別于有形資產的價值。正確理解數據資產價值是實現數據共享與交換、發展數字經濟的前提與保障。首先分析數據價值評價方法及數據資產的商品屬性,然后討論數據資產交易的市場模型,最后在綜合數據資產屬性及市場模型的基礎上提出參與者利潤建模方法。提出模型化數據市場參與者利潤的相關特性,為參與者進入市場提供理論參考依據。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00013.shtml
基于區塊鏈的數據市場
作者:汪靖偉,鄭臻哲,吳 帆,陳貴海
摘要:在互聯網時代,每天都產生著不可估量的數據,在數據共享過程中,涌現出了數據隱私性和所有權歸屬等復雜問題。區塊鏈是一種去中心化的分布式數據存儲技術,引入區塊鏈能消除集中式數據市場的弊端,但同時分布式數據市場又產生了安全與隱私問題。綜述了國內外大數據交易市場的產業現狀和研究進展,提煉了基于區塊鏈的大數據共享流通平臺應滿足的性質。根據這些性質提出了一個基于區塊鏈的數據市場框架,分析和討論了這個框架中的安全性和隱私性問題及對應的解決方案?;谶@個框架,實現了一個數據市場測試系統,并證實了該框架的可行性和安全性。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00021.shtml
數據資產標準研究進展與建議
作者:戴炳榮,閉珊珊,楊 琳,紀婷婷,陳 美
摘要:數據被認為是各類組織的寶貴資產,數據資產的標準化研究受到各個國家、行業和組織的重視。從標準視角介紹了國內外相關組織的數據資產方向的理論研究、實踐以及與數據資產相關的標準化研究進展,并提出了數據資產的標準化思路以及數據資產管理的通用過程框架,為數據資產的管理和應用提供參考。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00036.shtml
面向價值實現的數據資產管理體系構建
作者:李雨霏,劉海燕,閆 樹
摘要:數據被認為是各類組織的寶貴資產,數據資產的標準化研究受到各個國家、行業和組織的重視。從標準視角介紹了國內外相關組織的數據資產方向的理論研究、實踐以及與數據資產相關的標準化研究進展,并提出了數據資產的標準化思路以及數據資產管理的通用過程框架,為數據資產的管理和應用提供參考。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00045.shtml
專題:面向大數據處理的數據流計算技術
導讀
作者:周傲英,?于戈
數據流(data flow)是麻省理工學院(MIT)的Jack B.Dennis教授在20世紀70年代提出的一種計算機體系架構,這在當時是很大膽的想法。此前,馮?諾依曼在1946年提出的以存儲程序和順序執行為主要特征的體系結構是人們唯一的選擇。相對于數據流,傳統的體系結構被歸為控制流(control flow)一類。與控制流相比,數據流計算有天然的并行性,這使得它在早期超級計算機的發展歷史上產生了重要的影響。雖然數據流計算機至今沒有成為主流,但是在大數據時代,計算機有史以來的“以計算為中心”真正轉變成“以數據為中心”,數據流由于其自身的特點將重新煥發迷人的魅力。在我們承擔的國家重點研發計劃項目“面向異構體系結構的高性能分布式數據處理技術與系統”中,數據流是最重要的一個關鍵詞,從面向用戶的編程模型和工具到大數據處理的計算模型,再到GPU能力的充分發揮;從計算機集群資源管理到分布式緩存等數據管理,數據流計算的思想和技術是貫穿其中的一條主線。通過兩年來的深入研究和比較,尤其是在系統開發和應用實踐的過程中,項目組對于數據流在大數據處理中的應用有了較為深刻的認識,我們把涉及數據流計算關鍵技術的5篇文章匯集成“面向大數據處理的數據流計算技術”專題,以饗讀者,懇請批評指正。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00057.shtml
面向大數據處理的數據流編程模型和工具綜述
作者:鄒驍鋒,陽王東,容學成,李肯立,李克勤
摘要:利用大數據計算平臺對大量的靜態數據進行數據挖掘和智能分析助推了大數據和人工智能應用的落地。在面臨互聯網、物聯網產生的日益龐大的實時動態數據的處理需求時,數據流計算被逐步引入目前的一些大數據處理平臺中。針對數據流的編程模型,比較了傳統軟件工程的面向數據流的分析和設計方法與目前針對大數據處理平臺的數據流編程模型提供的結構定義和模型參考,分析了兩者的差異和不足,總結了數據流編程模型的主要特征和關鍵要素。分析了目前數據流編程的主要方式以及與主流編程工具的結合,針對大數據處理的數據流計算業務需求,給出了可視化數據流編程工具的基本框架和編程模式。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00059.shtml
數據流計算模型及其在大數據處理中的應用
作者:畢倪飛,丁光耀,陳啟航,徐 辰,周傲英
摘要:如今無界、亂序的大規模數據集越來越普遍,并且消費者對這些數據集的處理需求日益復雜,如時間語義、窗口以及處理時延等。針對在無界、亂序的大規模數據集上演進的數據處理需求,探討了大數據處理中的數據流計算模型。一方面,從執行引擎層面分析了大數據處理中的數據流計算模型所體現的數據流圖;另一方面,從統一編程層面分析了大數據處理中的數據流計算模型所體現的數據流編程模型。在此基礎上,進一步結合Spark批處理引擎和Flink流計算引擎等多個執行引擎,對比分析了數據流圖和數據流編程模型在2類執行引擎中的具體實現。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00073.shtml
數據流計算環境下的集群資源管理技術
作者:湯小春,符 瑩,丁 朝,毛安琪,李戰懷
摘要:以集群為基礎的高性能計算的發展經歷了3個階段的演化,即計算子系統與存儲子系統的分離、計算子系統與存儲子系統的融合以及以數據并行為基礎的dataflow編程模型。隨著Spark、Flink等數據流編程模型在大數據計算領域的廣泛使用,計算作業類型千變萬化,如何保證各種數據流計算作業對集群資源的共享使用是集群資源管理的核心,也是降低基礎設施成本的主要手段。分析集群資源管理的歷史變化,從數據流編程模型的角度出發,對HoD、集中式、雙層調度、分布式以及混合式管理展開了深入的探索,介紹了其各自的優缺點以及應用現狀,為數據流計算環境下的集群資源管理和調度的使用或者研發提供一定的參考和借鑒。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00087.shtml
分布式數據流計算系統的數據緩存技術綜述
作者:袁旭初,付 國,畢繼澤,張巖峰,聶鐵錚,谷 峪,鮑玉斌,于 戈
摘要:數據流編程模型以其高度并行計算、支持流水線處理、支持函數式編程等優點被許多主流的計算系統采用。在分布式數據流系統和異構數據流系統中,算子之間數據生產和數據消化的速度不一致可能會導致數據堆積或者算子閑置等問題。為支持高效的數據流系統,需要設計緩存系統,以保證數據流的高效緩存和移動。選取了幾個典型的分布式數據流系統與分布式消息隊列系統進行系統分析,并總結了目前消息隊列系統對數據流緩存系統的支持程度。最后對數據緩存技術進行了闡述,并分析了未來的數據流緩存系統的需求和研究方向。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00101.shtml
數據流技術在 GPU和大數據處理中的應用
作者:蘇華友,梅松竹,李榮春,竇 勇
摘要:數據流模型是一種高效的計算模型,由于其在并行性方面具有天然的優勢,數據流技術在軟硬件領域得到了廣泛的應用。在硬件體系結構方面,數據流模型引領計算機體系結構在傳統馮·諾伊曼架構下向支持更高并發的方向發展。基于超長向量處理單元的流處理和SIMT的現代GPU就廣泛使用了數據流技術的思想。在編程模型方面,數據流思想在大數據編程模型領域得到了廣泛應用,例如MapReduce和Spark等。從數據流模型的角度多層次分析了英偉達GPU的體系結構以及CUDA編程模型,闡述了數據流模型在GPU軟硬件系統中的應用。分析了數據流思想和GPU大規模并行處理體系結構在大數據處理中的應用和發展趨勢。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2020/2096-0271/2096-0271-6-3-00117.shtml
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中文科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,并被評為2018年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的《大数据》2020年第3期目次摘要的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 作者:王雨华(1970-),男,中国科学
- 下一篇: 【CyberSecurityLearni