當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

面向智能化软件开发的开源生态大数据

發布時間：2025/3/15 编程问答 19 豆豆

生活随笔收集整理的這篇文章主要介紹了面向智能化软件开发的开源生态大数据小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

點擊上方藍字關注我們

面向智能化軟件開發的開源生態大數據

張洋¹,?王濤¹,?尹剛^2,3,?余躍¹,?黃井泉³

1?國防科技大學計算機學院，湖南長沙 410073

2?綠色計算產業聯盟，北京 100036

3?湖南智擎科技有限公司，湖南長沙 410073

摘要：開源軟件開發過程中包含大量有價值的數據，針對其數據規模巨大、碎片分散、快速膨脹的特點，研究了軟件工程開源生態大數據體系，提出了一種自生長的采集處理框架與匯聚共享環境，闡述了基于軟件工程開源生態大數據的智能化軟件開發，以及基于軟件工程開源生態大數據分析挖掘的典型應用，為面向智能化軟件開發的開源生態大數據研究與應用提供相關指導。

關鍵詞：?智能化軟件開發?;?開源軟件?;?開源生態?;?大數據

論文引用格式：

張洋, 王濤, 尹剛, 等. 面向智能化軟件開發的開源生態大數據[J]. 大數據, 2021, 7(1): 94-106.

ZHANG Y, WANG T, YIN G, et al. Big data of open source ecosystem for intelligent software development[J]. Big Data Research, 2021, 7(1): 94-106.

1 引言

自20世紀末以來，開源軟件在現代社會的各個領域得到了廣泛的應用，取得了令人矚目的成就。Black Duck公司2017年的調查報告顯示，全球86%的企業在搭建業務時全部或部分使用了開源軟件，其中60%的公司還在增加開源軟件的使用比重。開源軟件的開發活動以互聯網軟件社區為平臺，其開發過程和制品數據對外開放，允許不同類型的開發者參與其中，形成一種大眾參與的開源模式，給開源世界帶來了強大的生產力。開源模式中大眾貢獻者可以自由地實踐分布式協同，催生了許多群體化軟件開發方法和一系列優質的開源社區。特別是，近年來云計算、大數據、人工智能、物聯網等對國民經濟發展產生重大影響的信息化基礎設施絕大多數是以開源軟件為核心構建而成的，開源軟件已經在全球軟件產業占據主導地位。

與傳統工業化軟件生產相比，大眾化開源軟件生產的開發數據和應用數據高度開放且規模巨大。目前，支持大眾化軟件生產和應用活動的開源社區包含了大量有價值的數據，如軟件代碼、軟件版本、容器鏡像等軟件制品和過程數據，以及軟件問答、軟件評價等軟件交流和反饋數據，這些數據涵蓋開發數據、交付數據及應用數據等全維度數據類型，涉及開發制品、開發過程、軟件產品、軟件鏡像、咨詢討論與應用問答等各個方面，具有規模巨大、碎片分散、快速膨脹的特點。如何構造高擴展、高性能的軟件工程開源生態大數據處理體系結構，建立多源異質、廣泛關聯、語義豐富、覆蓋全面的軟件工程開源生態大數據環境，分析提煉軟件知識并設計實現輔助開發工具，以提升軟件開發的智能化程度，已成為重要的科學問題。

本文研究了軟件工程開源生態大數據體系，并提出了一種自生長的采集處理框架與匯聚共享環境；然后，介紹了基于軟件工程開源生態大數據的智能化軟件開發，以及基于軟件工程開源生態大數據分析挖掘的典型應用，以期為面向智能化軟件開發的開源生態大數據研究與應用提供相關指導。

2 軟件工程開源生態大數據

傳統軟件數據挖掘主要關注同質和局部軟件工程數據，難以適應軟件工程開源生態大數據呈現出的異構多源、類型復雜、持續增長、廣泛互聯等新特性，全局視角下考察軟件大數據價值仍面臨巨大挑戰。本文以“主動感知、定向采集、多源關聯、增量檢測”機制構建自生長的軟件大數據環境，建立綜合互聯的大樣本軟件數據集合，以支持多維度、多譜系、貫通性的軟件知識提煉和智能釋放。

2.1 軟件工程開源生態大數據體系

通過對軟件生態進行全面梳理和分析，本文將軟件社區分為開發社區和應用社區，涵蓋軟件開發、發布和應用等不同階段，對軟件工程大數據進行調研分析。軟件工程大數據以代碼、文檔、開發記錄等文本為主體，語義豐富。為此，本文構建了系統的軟件工程開源生態大數據體系（如圖1所示），涉及開發制品、開發過程、軟件產品、軟件鏡像、咨詢討論和應用問答等各個方面，覆蓋GitHub、Apache、Topcoder、Docker Hub、OSCHINA以及Stack Overflow等各類型主流開源社區，為軟件工程研究和實驗提供了一個較完整的全局視圖。

圖1???軟件工程開源生態大數據體系

該體系主要包括開發數據、交付數據和應用數據三大類，每一類又被細分為多個子類。最終，該分類體系與當前的多種軟件倉庫、社區和論壇的具體數據格式建立了映射。具體如下。

（1）開發數據

開發數據以軟件工程中軟件開發設計的制品和過程為核心，其中開發制品包括源代碼、編譯文件和提交日志，開發過程則涉及開發人員、合并申請、問題跟蹤、郵件交互、持續集成和競爭式開發等多個方面。具體地，開發數據對應的數據源包括版本庫、Issue庫、郵件列表、評測工具和競賽系統，涉及的數據源實例有GitHub、Apache和Topcoder等。

（2）交付數據

交付數據主要是交付生產環境的軟件產品，同時隨著虛擬化技術和容器技術的發展，軟件鏡像作為一種特殊的軟件產品交付方式逐步興起并大量存在，因此其也單獨作為交付數據的一個子類。軟件產品數據涉及軟件的方方面面信息，包括軟件描述、軟件標簽、軟件分類和可執行程序本身；軟件鏡像與之類似，包括鏡像描述和鏡像文件等。交付數據主要來源于軟件產品頁面、軟件包和鏡像倉庫，具體實例包括OpenHub和Docker Hub等。

（3）應用數據

應用數據主要包括資訊討論和應用問答，其中資訊討論包括在線文檔、社區反饋、文檔標簽以及其他屬性等；應用問答則主要針對以提問和解答為主要形式的在線社區活動，涉及的數據包括問題與回復、問題標簽和其他屬性等。應用數據的主要數據來源為在線文檔和在線問答，具體實例有OSCHINA和Stack Overflow等。

在此基礎上，本文提出了分布式異構存儲的總體策略，設計和制定了多源異構的軟件工程大數據管理框架與環境。其總體主要包括以下4個層次。

● 數據源：軟件工程大數據涵蓋開發、發布、應用、運維等不同過程、不同類型和不同源的數據，包括版本庫、代碼倉庫、配置制品、軟件鏡像等。

● 數據存儲：主要實現對大規模異構軟件工程大數據的高效存儲和訪問。

● 數據處理：圍繞特定的任務和目標，將存儲的數據按需展開，并進行相應的處理，形成軟件知識庫。通過數據解析、融合等技術進行數據的二次加工和處理，包括通過分析不同數據類型之間的關聯和依賴、基于圖數據庫等存儲技術構建軟件領域的知識圖譜，進一步通過數據按需展開機制有效降低存儲資源的占用情況。

● 數據實例：通過豐富的接口和服務，針對不同的需求和應用提供相應的數據服務。針對圍繞的不同數據類型，對外提供的數據服務被分為4類，包括以項目為中心的數據服務、以測試為目標的數據服務、以人為中心的數據服務和以運維為目標的數據服務等。

2.2 軟件工程開源生態大數據采集處理框架

本文提出一種“增量式、多模式”的自生長數據采集處理框架（如圖2所示），該框架能夠針對不同類型的軟件數據進行匯聚、收集和整理。具體地，針對網頁數據、版本庫數據、缺陷庫數據等不同類型的數據，本文研究了主動感知、定向采集、多源關聯和增量檢測等關鍵技術，設計部署了分布式爬蟲，實現了網頁爬蟲、基于應用程序接口（application programming interface，API）的數據獲取和數據包直接下載等多種收集方式。具體如下。

圖2???軟件工程開源生態大數據采集處理框架

● 基于網絡爬蟲的數據收集方法：針對特定的軟件庫采用定點爬取的方式，通過分析特定數據源網頁中的數據特點和Schema格式，基于爬蟲常用的標簽匹配和正則表達式匹配等策略獲取相應的數據信息。為了解決爬取效率低和重復爬取的問題，采用分布式網絡爬蟲技術進行多任務的并行處理，從而大幅提高大規模軟件數據的爬取效率，另外，基于時間戳等信息實現周期性、增量式爬取，避免數據的重復獲取。其中，多數軟件數據基于爬蟲技術獲取，包括Apache基金項目的源碼、郵件、網頁和版本控制，Eclipse社區項目的缺陷報告和代碼，配資代碼庫和Docker Hub中的元數據信息、代碼制品及容器的Dockerfile，CSDN的博客、問答和論壇等。

● 基于API的數據收集方法：除了網絡爬蟲，部分開源軟件庫對外提供獲取和下載數據信息的開放API，因此可以通過調用API的方式獲取相應的數據信息，其中包括Topcoder的眾包開發數據、Apache基金會項目的缺陷報告等。

● 數據包直接下載方法：一些社區對歷史數據進行壓縮存檔，并直接對外提供數據下載地址，例如Stack Overflow社區的文檔數據等。

在此基礎上，軟件工程開源生態大數據采集處理框架整體可分為3層，包括數據獲取層、數據分析層以及持久化層，通過3個層次的協同配合，最終完成從數據的最初采集、數據的分析處理，到最后數據的展示。其中，數據獲取層的主要功能是完成數據的采集工作，為平臺提供高效、穩定、持續、準確的數據服務。數據分析層對數據獲取層獲取的頁面信息進行抽取，提取出每個頁面中的關鍵信息，并對抽取結果進行驗證，通過驗證的頁面數據會被存儲到數據庫中，為數據分析做準備。該層還有一些數據挖掘算法，對所抽取的數據進行數據分析操作，包括社區關聯、軟件評估等。持久化層按照最終需要展示的數據格式，對之前得到的數據處理結果進行處理，并將處理結果存放于數據緩沖池中，最終源源不斷地向展示平臺傳輸，為平臺的展示提供數據支持。

2.3 軟件工程開源生態大數據的匯聚共享

針對軟件工程開源生態大數據規模大、多樣性和異構性的特點，本文采用開放共享、分散存儲、平臺匯聚、按需獲取的方式，形成一個大規模軟件工程大數據共享平臺，如圖3所示。目前該平臺已實現對全球PB級開源代碼和鏡像等軟件工程大數據的跟蹤、獲取，為軟件工程研究和實踐提供了堅實的數據基礎。

圖3???軟件工程大數據共享平臺

軟件工程大數據共享平臺采用分散存儲、平臺匯聚的模式提供共享管理和在線訪問統一入口，屏蔽底層數據存儲的分散性和多樣性，提供風格一致的門戶環境。具體存儲結合實際數據特征采用結構化存儲與非結構化存儲相結合的方式，平臺核心架構設計如下。

● 以多源異構的軟件工程開源生態大數據為數據源，基于網絡爬蟲技術實現數據的定向收集和通用收集，同時還包括基于API的數據獲取和直接獲取。

● 采用結構化與非結構化相結合的方式進行存儲，針對元數據信息主要采用基于關系數據庫和NoSQL數據庫的方式進行存儲，并結合聯合文件系統（aufx和zfs等）等技術支持非結構化數據（尤其是文檔和代碼）的有效存儲。為了減少數據存儲的資源占用問題，針對軟件版本數據提供了按需進行版本分支展開的機制。

● 為本地數據增加索引，提供知識描述表作為本地數據描述、共享和權限控制的基本單位，同時支持知識描述表的繼承關系和多種映射規則定義，并提供知識圖譜作為知識描述表之間邏輯關聯關系的描述工具和知識檢索工具。

● 平臺提供統一訪問門戶，并可根據需求動態調整數據類別條目，通過統一資源接口，支持用戶快速獲得原始或加工過的各類軟件工程數據。

平臺被部署于UCloud和阿里云上，提供匯聚數據說明及訪問入口，小規模數據集被直接上傳至共享平臺，大規模數據集/應用服務由數據共享單位自行管理。該平臺具有高度靈活性和可擴展性，能夠基于軟件工程開源生態大數據體系建立多樣化的數據類型導航機制，涉及的典型軟件工程數據包括軟件工程科研數據、開源代碼數據、Docker鏡像數據以及知識圖譜數據等不同類型。

3 基于軟件工程開源生態大數據的智能化軟件開發

立足于軟件工程開源生態大數據，越來越多的研究團隊基于不同類型的開源大數據進行智能化的軟件開發研究。如圖4所示，從基于代碼、日志、郵件等開發數據的知識圖譜構造，到融合缺陷、社區問答等開發數據和應用數據的軟件代碼缺陷定位與修復、問答資源推薦，再到針對配置文件、容器鏡像等交付數據的運維數據管理，這些前沿探索為人們更好地利用開源大數據輔助智能化軟件開發提供了方法指導與工具支持。

3.1 基于開發數據的軟件知識圖譜構造

相關研究針對軟件缺陷發現而構造的軟件缺陷知識圖譜（bug knowledge graph，BKG）利用主題模型LDA（latent dirichlet allocation）和文本相似度算法分別自動化地進行實體識別和關系抽取，但其受限于缺陷報告數據和源代碼數據，不支持其他數據源的知識擴展。針對通用軟件的弱點，相關研究推理并構造了CWE KG（common weakness enumeration knowledge graph），通過預定義的模板進行規范，采取社區平臺的方式進行人工編輯，但是其并非自動化方法，受限于與軟件弱點相關的文檔數據，不支持其他數據源的知識擴展。此外，針對軟件開發在線問答，相關研究構造了HDSKG（harvesting domain specific knowledge graph），通過依賴解析和基于規則的方法進行實體和關系的識別，采用支持向量機（support vector machine，SVM）的分類算法評估三元組，但是其是半自動化方法，主要來源于Stack Overflow的在線問答數據，可擴展性受限。因此，基于軟件工程開源生態大數據中的開發數據，相關研究通過探索面向多源異質、動態增長的軟件大數據的軟件知識自動識別、抽取、關聯與融合過程，提煉出大規模、內容全面、語義豐富的軟件知識圖譜，為軟件構造過程中的智能化輔助服務提供了基礎支撐。給定一個可復用的軟件項目及與其相關的大量軟件項目數據，這些研究提出的方法能夠自動從中抽取出概念、實體等結點，并建立這些結點之間多源異構、類型豐富的關系，形成這個軟件項目特定的一個軟件項目知識圖譜。該知識圖譜基于圖數據庫，實現了對知識圖譜的存儲、索引、查詢等基礎支持的建立，為軟件項目數據的解析、關聯融合與知識挖掘提煉提供了支撐環境。在數據解析方面，圖譜兼容多種不同類型的軟件工程數據，包括：軟件源代碼、各種版本控制系統（如SVN、Git）的版本記錄、郵件列表日志、缺陷追蹤系統日志、HTML網頁文檔、Word文檔、PDF文檔等。同時，該知識圖譜構造工具內置了多種可追蹤性關聯分析與知識補全模塊，能夠充分對不同來源的軟件數據間的語義關聯進行智能恢復補全，且能夠從數據中提煉出更適合管理者、開發者與復用者理解的知識。

圖4???基于軟件工程開源生態大數據的智能化軟件開發研究

3.2 基于缺陷與社區問答數據的軟件代碼缺陷智能定位與修復

基于軟件工程開源生態大數據中的開發數據和應用數據，相關研究團隊圍繞基于缺陷和社區問答數據的軟件代碼缺陷智能定位與修復問題開展了大量研究。他們針對缺陷報告與關聯代碼間的詞共現關系、缺陷報告文本附著的元數據，以及代碼規模越大越容易出現軟件缺陷等特點，構造了一個基本的監督式文本主題模型STMLocator，并給出了相關訓練與預測算法。相較于傳統的信息檢索方法以及基于頻譜的方法，該方法能夠將修復歷史作為監督信息，同時將文本相似度與語義相似度結合，實現更高精度的缺陷定位。在開源項目Eclipse的多個子項目（PDE、Platform、JDT）收集的真實數據上的預測準確率相較同類工作最高提升23.6%。另外，為了研究缺陷報告文本附加信息對缺陷定位的影響，Wang Y J等人提出了L2SS+模型簇，在多個實際數據集上的實驗結果表明，L2SS+CM模型，即產品模塊信息對缺陷定位準確率影響最顯著，預測準確率較同類工作最高提升18.7%。在基于社區問答網站的軟件缺陷修復信息智能推薦技術方面，為了進一步精確獲取和分類社區問答網站的內容，相關研究分析了網站文本內容的自動標簽推薦問題，針對標簽與文本詞之間的共現關系、標簽之間的關聯關系等特點，Tang S J等人提出了一個iTAG深度學習模型，并給出了相關訓練與預測算法。在從Stack Overflow程序員社區問答網站等獲取的真實數據集上，iTAG模型較其他同類工作（#TagSpace、Maxide等）在預測準確率上有顯著提升。另外，iTAG模型在結果可視化解釋、發現更多合理的標簽等方面具有優勢。

3.3 基于上下文感知的軟件問答資源推薦技術

近些年，相關研究團隊立足于軟件工程開源生態大數據中的應用數據和交付數據，圍繞上下文感知的軟件問答資源推薦技術開展了富有成效的研究。目前大部分的軟件問答推薦系統沒有考慮上下文，有的雖然考慮了上下文，但是還是以代碼本身關鍵詞為主，沒有考慮其中的語義信息，也沒有充分挖掘已有的海量的問答知識。參考文獻針對此設計了基于主題模型的軟件問答推薦系統，推薦系統通過主題模型組織整理現有的全量問答數據，并推斷用戶代碼的行為，通過不同場景下的用戶行為抽取不同的代碼上下文，根據代碼上下文向開發人員推薦不同的問答。推薦問答的關鍵操作是計算代碼上下文與問答數據的相關性，其中的一個關鍵問題在于問答數據的范圍，直觀的選擇是計算代碼上下文與全量問答數據的相關性，然而這在實際應用中是不可能的，因此首先要做的是縮小計算范圍，計算代碼上下文和一部分問答數據的相關性。為了縮小計算的范圍，降低計算復雜度，Shao B等人抽取代碼上下文中的關鍵詞，利用關鍵詞檢索得到較小的問答數據集合，然后計算代碼上下文和每一個問答數據的相關性，對所有結果進行排序后推薦給開發人員。推薦系統監測開發人員開發代碼，當開發人員停止代碼或者程序運行時，拋出異常等行為觸發推薦機制，推薦系統通過抽象語法樹和主題模型分析代碼上下文，抽取關鍵詞，檢索多源數據，對返回的數據進行分析排序，并最終展示給用戶。

3.4 面向軟件一體化開發運維的數據匯聚和知識管理

基于軟件工程開源生態大數據中的交付數據，相關研究團隊針對Docker鏡像設計了一種海量數據匯聚、管理、知識抽取和質量評價的系統化方案和服務。其成果首先實現了增量式、高并發的Docker數據匯聚和管理方法，支持對Docker Hub上百萬級Docker項目數據的自動獲取與增量更新，實現了項目數據的可發現和可追蹤。具體地，在數據匯聚方面，針對Docker項目數據量大、難以獲取項目整體列表等技術問題，參考文獻提出了一種增量式的數據并發獲取方式，突破了高命中率的檢索關鍵詞生成算法、高效的Docker項目元數據更新比對與融合算法，從而提高數據獲取的覆蓋度以及對Docker項目數據更新的敏感度。在基于返回的檢索結果列表進行Docker項目詳細元數據獲取的過程中，考慮到檢索結構數據量大（通常能夠達到萬級或十萬級），他們采用“分而治之”的策略，對大規模的搜索返回結果實施并發的多線程獲取方式，顯著地提升了數據匯聚效率。最后，基于多種啟發性規則對初步獲取的Docker項目元數據進行分析、對比和過濾，識別其中的冗余和更新內容，保證數據內容的一致以及數據內容的更新，實現了海量Docker項目相關數據的高效匯聚和增量更新。

4 基于軟件工程開源生態大數據分析挖掘的典型應用

近年來，越來越多的基于軟件工程開源生態大數據分析挖掘的應用誕生，并不斷發展。其中，針對軟件問答社區（如Stack Overflow）、開源軟件項目（如Apache、安卓項目等）、軟件開發工具（如Eclipse）、開發者數據（眾包開發者數據、開發過程數據等）類型的數據進行了匯聚和收集整理，OSSEAN構建了面向全球開源軟件的檢索與分析平臺。OSSEAN平臺的基本思路為：在軟件消費社區中找到關于軟件項目的文檔；利用這些文檔對軟件進行評估、比較、排序。通過獲取到的海量的開源社區數據，OSSEAN平臺能夠提供一些有趣的服務，如開源生態系統的度量、軟件排序以及熱點話題分析。OSSEAN平臺數據獲取模塊已覆蓋全球20多個主要的開源社區，并對這些社區進行持續監控、實時抓取，抓取和分析的數據包括超過14 0萬個開源項目/倉庫的元數據以及超過2 000萬條在線討論數據。同時，OSSEAN平臺的跨社區關聯與分析模塊通過對多源異構數據的深度互聯，建立相應的異質信息網絡，并在此基礎上實現對開源軟件的分析、檢索與排序等服務。

SnowGraph（software knowledge graph）在對開源社區軟件項目進行大量調研與實踐的基礎上，設計并實現了軟件項目知識圖譜自動構造支持平臺。對于一個待復用的軟件項目，SnowGraph能夠以自動化的方法對其中的多源異構數據進行處理，將分散、非結構化的信息提煉為廣泛關聯、語義性強的知識，并以知識圖譜的形式進行表示；在此基礎上，將知識圖譜融入機器對無結構文本的處理過程，進而為復用者提供準確有效的智能問答服務，從而提高軟件復用過程的效率與質量。目前，SnowGraph的項目原始數據規模大約為500 GB，其中包含軟件項目源代碼、軟件開發版本記錄、軟件缺陷追蹤記錄、軟件開發郵件記錄以及Stack Overflow在線論壇記錄等。最終，SnowGraph自動構造了192個軟件項目知識圖譜，圖數據庫規模大約為100 GB。此外，SnowGraph平臺集成了軟件項目的智能問答服務系統，即開發人員在復用一個軟件項目時，提出與軟件領域相關的開發問題，知識圖譜返回相應的代碼/文檔作為答案，從而輔助開發人員進行軟件復用。與BKG、CWE KG、HDSKG等其他主流軟件知識圖譜相比，SnowGraph采取了多種信息抽取的方法來協同進行知識圖譜的全自動化構造，自動化程度更高，并且具備很好的通用性和可擴展性，能夠對未來可能出現的新的知識需求、知識來源，以及知識抽取、關聯、提煉等進行支持。此外，SnowGraph實體類型和關系類型明顯比其他主流軟件知識圖譜豐富，從而在對應的軟件知識表示和知識利用的任務上具備更好的效果。

CodeWisdom開發了代碼大數據與智能化軟件開發研究成果展示與服務平臺。該平臺在GitHub等開源軟件社區的軟件代碼及軟件開發歷史、Stack Overflow等軟件開發問答網站的問答知識，以及API文檔等互聯網軟件開發資源的基礎上，利用程序分析、深度學習、自然語言處理、知識圖譜、數據挖掘等技術，充分發掘代碼大數據中蘊含的知識，通過檢索、推薦、問答、可視化等多種手段提供智能化軟件開發支持。

5 結束語

本文提出了軟件工程開源生態大數據體系，構建了自生長的采集處理框架和匯聚共享環境，并闡述了基于軟件工程開源生態大數據的智能化軟件開發的相關研究以及典型應用情況。面向智能化軟件開發的開源生態大數據研究具有很強的研究意義和實際價值，未來需要進行進一步的深入探索。

作者簡介

張洋（1991-），男，博士，國防科技大學計算機學院助理研究員，中國計算機學會會員，主要研究方向為實證軟工程、軟件版本庫挖掘、DevOps等。

王濤（1986-），男，博士，國防科技大學計算機學院副研究員，中國計算機學會會員，主要研究方向為分布式計算、軟件工程、數據挖掘等。

尹剛（1975-），男，博士，綠色計算產業聯盟實踐教學工作委員會副主任，中國計算機學會會員，主要研究方向為在線教育、分布式計算、軟件工程、數據挖掘、云計算等。

余躍（1988-），男，博士，國防科技大學計算機學院副研究員，中國計算機學會會員，主要研究方向為數據挖掘、實證軟件工程、社交化編碼等。

黃井泉（1986-），男，湖南智擎科技有限公司高級工程師，主要研究方向為在線教育、軟件工程、數據挖掘等。

聯系我們:

Tel:010-81055448

? ? ? ?010-81055490

? ? ? ?010-81055534

E-mail:bdr@bjxintong.com.cn?

http://www.infocomm-journal.com/bdr

http://www.j-bigdataresearch.com.cn/

轉載、合作：010-81055537

大數據期刊

《大數據（Big Data Research，BDR）》雙月刊是由中華人民共和國工業和信息化部主管，人民郵電出版社主辦，中國計算機學會大數據專家委員會學術指導，北京信通傳媒有限責任公司出版的期刊，已成功入選中文科技核心期刊、中國計算機學會會刊、中國計算機學會推薦中文科技期刊，并被評為2018年、2019年國家哲學社會科學文獻中心學術期刊數據庫“綜合性人文社會科學”學科最受歡迎期刊。

關注《大數據》期刊微信公眾號，獲取更多內容

總結

以上是生活随笔為你收集整理的面向智能化软件开发的开源生态大数据的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【2017年第1期】大数据能力开放平台创
下一篇：《大数据》再获新荣誉——“综合性人文社会