《大数据》2021年第6期目次摘要
點擊上方藍字關注我們
《大數據》
第7卷第6期 2021年11月
大數據2021年第6期
(點擊原文鏈接在官網閱讀完整文章)
目次
01?專題導讀:大數據支撐的智能應用
周斌, 秦永彬
02?基于材料數值計算大數據的材料輻照機理發現
任帥, 陳丹丹, 儲根深, 白鶴, 李慧昭, 何遠杰, 胡長軍
03?基于BERT閱讀理解框架的司法要素抽取方法
黃輝, 秦永彬, 陳艷平, 黃瑞章
04?結合案件要素序列的罪名預測方法
孫倩, 秦永彬, 黃瑞章, 劉麗娟, 陳艷平
05?基于多輸入模型及句法結構的中文評論情感分析方法
張寶華, 張華平, 厲鐵帥, 商建云
06?大數據認知計算在內容安全管控中的應用
杜雪濤
07?基于特征選擇的局部敏感哈希位選擇算法
周文樺, 劉華文, 李恩慧
08?面向非易失性內存的持久索引數據結構研究綜述
王永鋒, 陳志廣
09?大數據定價方法的國內外研究綜述及對比分析
劉枬, 郝雪鏡, 陳俞宏
10?水環境模型與大數據技術融合研究
馬金鋒, 饒凱鋒, 李若男, 張京, 鄭華
11?時間頻率科學數據管理控制與應用
章宇, 袁海波, 王燕平, 董紹武, 張繼海
12?基于ISM的大數據在建筑領域中的應用障礙分析
紀穎波, 趙子豪, 姚福義
13?企業電力征信大數據價值挖掘與應用
辛保江, 李德文, 王蘭蘭
摘要
專題:大數據支撐的智能應用
專題導讀:大數據支撐的智能應用
作者:周斌,?秦永彬
摘要:信息技術的發展使得數據采集、存儲、管理等成本下降,同時也給機器學習等人工智能方法提供了足夠的訓練樣本,使大數據成為人工智能發展的三大重要基礎(數據、算法和算力)。在近年來大數據技術發展的基礎上,人工智能在技術發展和落地應用等方面都獲得了諸多突破。在當前大數據產業鏈日趨成熟的背景下,大數據與人工智能的結合也在向更全面的方向發展,跨越了棋類游戲、網頁搜索、語音合成、人臉識別等單點應用,逐步發展到無人駕駛、智慧交通、智能司法、工控機器人、智能網絡應用等更復雜的應用形態。本專題選取了材料科學、智能司法、內容分析等多個領域中的一些成功案例,探討了大數據技術如何支撐人工智能中的知識表示、推理預測、智能算法、認知計算等方面和環節,達到支撐整個領域智能應用的目標。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00001.shtml
基于材料數值計算大數據的材料輻照機理發現
作者:任帥,?陳丹丹,?儲根深,?白鶴,?李慧昭,?何遠杰,?胡長軍
摘要:材料輻照效應的數值模擬計算是認識核材料服役性能的重要手段,基于超級計算機的大規模、高保真材料數值模擬計算會產生海量數值計算數據,如何針對數值計算大數據的特點,在實現其高效存儲的基礎上,通過挖掘總結輻照損傷機理和性能演化規律,對于核材料設計研發、核安全等具有重要意義。論述了材料數值計算大數據的定義及其本質特征,綜述了近年來的相關工作。以自主研發的材料輻照效應分子動力學軟件MISA-MD和隨機團簇動力學軟件MISA-SCD在國產超級計算機上的實際算例為基礎,提出了一種適用于材料數值計算大數據的、多尺度關聯與耦合的分布式數值計算大數據存儲體系(NDSA);采用XGBoost算法實現了MD中Frenkel缺陷對數的精確預測,基于并查集算法實現了級聯碰撞團簇的劃分;基于密度聚類的方法對KMC數值計算大數據進行挖掘,發現了類環狀團簇,實現了原子團簇的識別與分類;基于第一性原理數值計算大數據庫對現有的勢函數模型進行了改進,提出了新的勢函數模型構建方法AIPM。最后對材料數值計算大數據的應用前景進行了展望。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00003.shtml
基于BERT閱讀理解框架的司法要素抽取方法
作者:黃輝,?秦永彬,?陳艷平,?黃瑞章
摘要:司法要素抽取是司法智能化輔助應用的重要基礎,其目的是判別裁判文書涉及的關鍵案情要素。以往司法要素抽取通常采用多標簽分類方法進行建模,模型主要依賴于裁判文書文本特征,忽略了要素標簽的語義信息。同時,由于司法數據集存在樣本分布不均衡的情況,分類方法會因負例過多而導致模型性能不佳。針對上述問題,提出基于BERT閱讀理解框架的司法要素抽取方法。該方法引入標簽信息和法律先驗知識構造輔助問句,利用BERT機器閱讀理解模型建立輔助問句和裁判文書之間的語義聯系。同時,在問句中標簽所在位置前后增加特殊標識符以增強模型的學習能力。實驗結果表明,該方法在CAIL2019要素抽取公開數據集上性能得到顯著提升,在婚姻家庭、勞動爭議、借款合同3種案由上分別提升F1值2.7%、11.3%、5.6%。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00019.shtml
結合案件要素序列的罪名預測方法
作者:孫倩,?秦永彬,?黃瑞章,?劉麗娟,?陳艷平
摘要:罪名預測指根據給定的案情事實找到適用罪名。現有罪名預測方法主要使用文本內容進行分類,但無法有效地利用文本中的案件要素。針對現有方法的不足,提出了一種結合案件要素序列的罪名預測方法。該方法將案情事實過程表示為一系列以“行為”為核心且具有時序關系的案件要素序列,然后利用圖卷積神經網絡進行表示,最后融合文本語義特征來預測案件罪名。實驗表明,該方法比現有方法具有更好的預測性能。同時,該方法在對易混淆罪名的區分方面也有較好的表現。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00030.shtml
基于多輸入模型及句法結構的中文評論情感分析方法
作者:張寶華,?張華平,?厲鐵帥,?商建云
摘要:海量的網絡文本給情感分析任務帶來了巨大的機遇和挑戰,傳統基于規則的方法已經很難勝任這類文本的分析工作,現有的深度學習方法存在一些不足,一方面模型的輸入只包括文本嵌入矩陣,缺乏其他特征的使用;另一方面,詞嵌入算法會導致文本結構信息缺失,進而影響分析效果。在對基于規則的情感分析方法中的句法規則進行研究的基礎上,提出了一種結合MCNN、LSTM和全連接神經網絡的多輸入模型。同時在深度學習模型中構建了句法特征提取器來提取句法特征。在3個公開數據集上進行了實驗,結果表明,構建的模型較其他模型擁有更好的分類性能,且句法規則特征的引入對模型的分類效果有一定的提升。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00041.shtml
大數據認知計算在內容安全管控中的應用
作者:杜雪濤
摘要:通信網絡中存在海量垃圾和不良信息,這些信息需要被閱讀和理解,以便對其進行有效的特征提取和攔截封堵。基于人工分析的方法已經無法達到目的,需要使用基于大數據的認知計算技術代替人工進行海量的數據分析和理解,幫助人們制訂內容安全管控策略。針對電信詐騙治理、不良消息治理、變體消息治理和不良網站治理4個方面遇到的實際問題,分別提出了大數據認知計算的解決方案,并給出了創新性實踐的效果。實踐表明,提出的解決方案能夠快速發現不良信息,有效地提升內容管控質量。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00053.shtml
研究
基于特征選擇的局部敏感哈希位選擇算法
作者:周文樺,?劉華文,?李恩慧
摘要:作為主流的信息檢索方法,局部敏感哈希往往需要生成較長的哈希碼才能達到檢索要求。然而,長哈希碼需要消耗巨大的存儲空間且攜帶大量的冗余哈希位。為了解決此問題,采用特征工程中10種簡單高效的選擇算法從長局部敏感哈希碼中選擇信息量豐富的哈希位,去除冗余、無效的哈希位。這10種選擇算法使用不同的方式來刻畫每一個哈希位的性能或兩個哈希位之間的相關性,如方差、漢明距離等。通過去除長哈希碼中性能較差或具有高相關性的哈希位進行哈希位的選擇。將選擇后的哈希碼與原哈希碼的性能進行比較。在4個常用數據集上的實驗結果表明,去除冗余哈希位后的哈希碼與原哈希碼的性能幾乎相同,且其哈希位的去除比率能達到30%~70%。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00067.shtml
面向非易失性內存的持久索引數據結構研究綜述
作者:王永鋒,?陳志廣
摘要:隨著非易失性內存從理論走向實用,現代存儲系統的設計與實現將迎來顛覆性變革。針對傳統存儲設備設計的存儲系統并不能充分利用非易失性內存帶來的性能紅利。為了構建高吞吐、低時延、大規模的存儲系統,迫切需要設計與非易失性內存硬件特性相匹配的持久索引數據結構,從而進一步提升性能。從持久索引數據結構出發,分別對B+-Tree和哈希表在非易失性內存上的設計和優化進行分析,比較其優缺點,并展望了該方向的機遇與面臨的挑戰。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00078.shtml
大數據定價方法的國內外研究綜述及對比分析
作者:劉枬,?郝雪鏡,?陳俞宏
摘要:大數據獨特的價值特征導致數據定價問題復雜,盡管研究者對此展開了大量研究,但大多角度單一且缺乏實際應用性。鑒于此,對大數據定價方法進行了綜述,梳理出成本導向、市場導向、需求導向、利潤導向以及基于生命周期定價的5種定價類型,對比了成本法、協議定價、市場法、收益法、基于質量以及基于查詢的定價6種主流定價方法的優劣勢;最后通過大數據定價流程分析進一步展現了不同定價方法各自的特點,并對數據定價方向進行了展望,以期為今后的相關研究提供一定的參考。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00089.shtml
水環境模型與大數據技術融合研究
作者:馬金鋒,?饒凱鋒,?李若男,?張京,?鄭華
摘要:水環境模型內部結構復雜且計算耗時,造成參數率定、多情景分析及決策優化過程中面臨高負荷計算難題,這極大地限制了其應用價值的發揮。如何融合水環境模型和大數據技術,深入挖掘模型應用潛力和充分發揮其應用價值是一個研究熱點。總結了水環境模型在實際應用過程中面臨的瓶頸,分析了大數據技術在解決這些問題上具有的潛力。基于現有成熟的大數據技術,提出了水環境模型與大數據技術融合框架,解決了水環境模型規模計算、規模存儲和應用分析問題。闡述了模型與大數據技術融合過程中面臨的問題,提出了具體的實現技術思路。通過SWAT模型率定應用案例,證明融合框架的可行性。最后探討了大數據背景下水環境模型的未來研究方向,指出開展復雜水環境模型的代理模型研究和水環境模擬優化框架研究是未來的發展趨勢。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00103.shtml
應用
時間頻率科學數據管理控制與應用
作者:章宇,?袁海波,?王燕平,?董紹武,?張繼海
摘要:時間頻率系統已經成為國家的戰略資源,時間頻率科學數據的應用涉及通信、電力、交通、戰事等方面,因此時間頻率科學數據的統籌梳理、管理控制、應用分析具有重要的現實意義。首先對時間頻率科學數據進行分類分級,同時制定數據共享策略,詳述時間頻率科學數據管理系統的組成架構以及時間頻率科學數據的質量控制方法;然后分析時間頻率科學數據開放共享面臨的問題,給出解決方案;最后闡述時間頻率科學數據的若干應用方向,對時間頻率科學數據的管理控制進行總結并展望。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00120.shtml
基于ISM的大數據在建筑領域中的應用障礙分析
作者:紀穎波,?趙子豪,?姚福義
摘要:大數據在建筑領域的應用程度低、推廣緩慢。準確識別大數據在建筑領域中的應用障礙因素,探索因素間的相互影響關系具有重大意義。通過對相關研究工作進行梳理,識別了12個障礙因素。使用解釋結構模型(ISM)確定了因素間的相互關系并將其轉化為鄰接矩陣。通過冪迭代分析建立了可達矩陣,確定了因素的層級關系。最后對因素間的影響傳遞路徑進行研究分析,給出了相應的應對建議,為我國建筑領域的大數據應用推廣提供了研究支持。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00128.shtml
企業電力征信大數據價值挖掘與應用
作者:辛保江,?李德文,?王蘭蘭
摘要:針對傳統電力征信平臺穩定性不足、測試準確性低等缺點,研究設計了一個電力征信大數據平臺。使用聯機分析法對電力大數據進行分析,并將其分為用戶行為、費用細則、用戶價值與個人信用四大類。以模塊化結構為基礎,分別對數據采集模塊、數據分析模塊、用戶交互模塊進行優化設計,采用KNN算法和交叉驗證法對用電數據進行分類與決策處理,得出區域的用電規律,以此設計和調整配電方案。最后將提出的平臺與傳統電力征信平臺進行對比,實驗結果表明,提出的平臺的穩定性和準確性都有所提升,在測試過程中準確性高達98.9%。
原文鏈接:http://www.infocomm-journal.com/bdr/article/2021/2096-0271/2096-0271-7-6-00138.shtml
聯系我們:
Tel:010-81055448
? ? ? ?010-81055490
? ? ? ?010-81055534
E-mail:bdr@bjxintong.com.cn?
http://www.infocomm-journal.com/bdr
http://www.j-bigdataresearch.com.cn/
大數據期刊
《大數據(Big Data Research,BDR)》雙月刊是由中華人民共和國工業和信息化部主管,人民郵電出版社主辦,中國計算機學會大數據專家委員會學術指導,北京信通傳媒有限責任公司出版的期刊,已成功入選中文科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊,并被評為2018年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。
關注《大數據》期刊微信公眾號,獲取更多內容
總結
以上是生活随笔為你收集整理的《大数据》2021年第6期目次摘要的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: eclipse aop连接点joinpo
- 下一篇: XCTF-Reverse:open-so