数据湖,已成为海量数据存储与分析的重要承载方式
簡(jiǎn)介: 在云計(jì)算和大數(shù)據(jù)時(shí)代,基于數(shù)據(jù)開展生產(chǎn)、運(yùn)營(yíng)、決策成為常態(tài),根據(jù)Gartner報(bào)道,2019年數(shù)據(jù)基建方面的采購(gòu)費(fèi)用飆升到660億美元,占據(jù)基礎(chǔ)架構(gòu)類軟件費(fèi)用的24%。數(shù)據(jù)的存儲(chǔ)及應(yīng)用體系是企業(yè)生態(tài)運(yùn)轉(zhuǎn)的中樞神經(jīng),數(shù)據(jù)湖已經(jīng)成為海量數(shù)據(jù)存儲(chǔ)與分析的重要承載方式。
在洶涌而至的信息化浪潮下,大數(shù)據(jù)技術(shù)不斷更新迭代,數(shù)據(jù)管理工具得到飛速發(fā)展,相關(guān)概念也隨之而生。數(shù)據(jù)湖(Data Lake)概念自2011年被推出后,其概念定位、架構(gòu)設(shè)計(jì)和相關(guān)技術(shù)都得到了飛速發(fā)展和眾多實(shí)踐,數(shù)據(jù)湖也從單一數(shù)據(jù)存儲(chǔ)池概念演進(jìn)為支撐高效、安全、穩(wěn)定企業(yè)級(jí)數(shù)據(jù)應(yīng)用的下一代基礎(chǔ)數(shù)據(jù)平臺(tái)。
?
?
此次發(fā)布的《數(shù)據(jù)湖應(yīng)用實(shí)踐白皮書》涵蓋了數(shù)據(jù)湖的定義與架構(gòu)、數(shù)據(jù)湖核心組件與方案介紹、數(shù)據(jù)湖構(gòu)建方案、應(yīng)用實(shí)踐等內(nèi)容,希望為用戶提供新的洞察。
?
?
通過閱讀本書,包括開發(fā)者、IT運(yùn)維人員、企業(yè)數(shù)字化管理者等可以全面了解阿里云基于云原生技術(shù)的企業(yè)級(jí)數(shù)據(jù)湖解決方案和相關(guān)產(chǎn)品,也能明晰傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖的差異。?
?
?
在云計(jì)算和大數(shù)據(jù)時(shí)代,基于數(shù)據(jù)開展生產(chǎn)、運(yùn)營(yíng)、決策成為常態(tài),根據(jù)Gartner報(bào)道,2019年數(shù)據(jù)基建方面的采購(gòu)費(fèi)用飆升到660億美元,占據(jù)基礎(chǔ)架構(gòu)類軟件費(fèi)用的24%。數(shù)據(jù)的存儲(chǔ)及應(yīng)用體系是企業(yè)生態(tài)運(yùn)轉(zhuǎn)的中樞神經(jīng),數(shù)據(jù)湖已經(jīng)成為海量數(shù)據(jù)存儲(chǔ)與分析的重要承載方式。
?
?
市場(chǎng)調(diào)研機(jī)構(gòu)Research and Markets發(fā)布的報(bào)告顯示,2020年,全球數(shù)據(jù)湖市場(chǎng)的價(jià)值為37.4億美元,預(yù)計(jì)到2026年將達(dá)到176億美元,在2021年至2026年的預(yù)測(cè)期間的復(fù)合年增長(zhǎng)率為29.9%。
?
?
云原生時(shí)代的到來,引領(lǐng)數(shù)據(jù)湖進(jìn)入了“云湖共生”新的階段。在此背景下,阿里云推出基于云原生技術(shù)的企業(yè)級(jí)數(shù)據(jù)湖解決方案,該方案采用了存儲(chǔ)計(jì)算分離架構(gòu),存儲(chǔ)層基于阿里云對(duì)象存儲(chǔ)OSS構(gòu)建,并與阿里云數(shù)據(jù)湖分析(Data Lake Analytics 簡(jiǎn)稱 DLA)、數(shù)據(jù)湖構(gòu)建(Data Lake Formation簡(jiǎn)稱 DLF)、E-MapReduce(簡(jiǎn)稱EMR)、DataWorks(簡(jiǎn)稱DW)等計(jì)算引擎無縫對(duì)接,且兼容豐富的開源計(jì)算引擎生態(tài)。
?
?
十年蹤跡十年心,結(jié)合先進(jìn)的數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)技術(shù),數(shù)據(jù)湖還能為企業(yè)提供預(yù)測(cè)分析,幫助企業(yè)構(gòu)建、優(yōu)化訓(xùn)練模型等。希望這本白皮書可以為企業(yè)和組織的數(shù)字化轉(zhuǎn)型實(shí)踐提供指引,為相關(guān)領(lǐng)域的業(yè)務(wù)決策者與實(shí)踐者提供面向行業(yè)應(yīng)用場(chǎng)景的重要參考。
原文鏈接
本文為阿里云原創(chuàng)內(nèi)容,未經(jīng)允許不得轉(zhuǎn)載。
總結(jié)
以上是生活随笔為你收集整理的数据湖,已成为海量数据存储与分析的重要承载方式的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微服务+异步工作流+ Serverles
- 下一篇: 如何在工作中快速成长?致工程师的10个技