怎样理解大数据概念?大数据有什么用处?
什么是大數據?
高速發展的信息時代,新一輪科技革 命和變革正在加速推進 ,技術創新日益成為重塑經濟發展模式和促進經濟增長的重要驅動力量,而“大數據”無疑是核心推動力。
那么,大數據是什么意思呢?如果從字面意思來看,大數據指的是巨量數據。那么可能有人會問,多大量級的數據才叫大數據?不同的機構或學者有不同的理解,難以有一個非常定量的定義,只能說,大數據的計量單位已經越過TB級別發展到PB、EB、ZB、YB甚至BB級別。
最早提出“大數據”這一概念的 是全球知名咨詢公司麥肯錫,它是這樣定義大數據的:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型以及價值密度低四大特征。
研究機構Gartner是這樣定義大數據的:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流轉優化能力來適應海量、高增長率和多樣化的信息資產。
若從技術角度來看,大數據的戰略意義不在于掌握龐大的數據,而在于對這些含有意義的數據進行專業化處理,換言之,如果把大數據比作一種產業,那么這種產業盈利的關鍵在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
大數據的特征
一般認為,大數據主要具有以下4個方面的典型特征,即大量(Volume)、多樣(Variety)、高速(Velocity)和價值(Value),即所謂的4V,接下來,通過一張圖來具休描述。
1. Volume(大量)
大數據的特征首先就是數據規模大。隨著互聯網、物聯網、移動互聯技術的發展,人和事物的所有軌跡都可以被記錄下來,數據呈現出爆發性增長。
單位換算格式
Byte1Byte=1024bit
KB1KB= 1024Byte
MB1MB= 1024KB
GB1GB= 1024MB
TB1TB= 1024GB
PB1PB= 1024TB
EB1EB= 1024PB
ZB1ZB= 1024EB
2. Variety(多樣)
數據來源的廣泛性,決定了數據形式的多樣性。大數據可以分為三類,一是結構化數據,如財務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;一是非結構化的數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;三是半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據間的因果關系弱。有統計顯示,目前結構化數據占據整個互聯網數據量的75%以上,而產生價值的大數據,往往是這些非結構化數據。
3.Velocity(高速)
數據的增長速度和處理速度是大數據高速性的重要體現。與以往的報紙、書信等傳統數據載體生產傳播方式不同,在大數據時代,大數據的交換和傳播主要是通過互聯網和云計算等方式實現的,其生產和傳播數據的速度是非常迅速的。另外,大數據還要求處理數據的響應速度要快,例如,上億條數據的分析必須在幾秒內完成。數據的輸人、處理與丟棄必須立刻見效,幾乎無延遲。
4.Value(價值)
大數據的核心特征是價值,其實價值密度的高低和數據總量的大小是成反比的,即數據價值密度越高數據總量越小,數據價值密度越低數據總量越大。任何有價值的信息的提取依托的就是海量的基礎數據。當然目前大數據背景下有個未解決的問題,如何通過強大的機器算法更迅速地在海量數據中完成數據的價值提純。
研究大數據有什么意義?
現在的社會是一個高速發展的社會,科技發達,信息流通,人們之間的交流也越來越密切,生活也越來越便捷,大數據就是這個高科技時代的產物。阿里巴巴創辦人馬云曾經說過,未來的時代將不是IT時代,而是DT的時代,DT就是Data Technology,數據科技,這顯示出大數據對于阿里巴巴集團來說是舉足輕重的。
有人把數據比喻為蘊藏能量的煤礦。煤炭按照性質有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數據并不在于“大”,而在于“有用”。數據的價值含量、挖掘成本比數量更為重要。對于很多行業而言,如何利用這些大規模數據,發掘其潛在價值,才是贏得核心競爭力的關鍵。
研究大數據,最重要的意義是預測。因為數據從根本上講,是對過去和現在的歸納和總結,其本身不具備趨勢和方向性的特征,但是可以應用大數據去了解事物發展的客觀規律、了解人類行為,并且能夠幫助我們改變過去的思維方式,建立新的數據思維模型,從而對未來進行預測和推測。比如,商業公司對消費者日常的購買行為和使用商品習慣進行匯總和分析,了解到消費者的需求,從而改進已有商品并適時推出新的商品,消費者的購買欲就會提高。
知名互聯網公司谷歌對其用戶每天頻繁搜索的詞匯進行數據挖掘,從而進行相關的廣告推廣和商業研究。
大數據的處理技術迫在眉睫,近年來各國政府和全球學術界都掀起了一場大數據技術的革命,眾人紛紛積極研究大數據的相關技術。很多國家都把大數據技術研究上升到了國家戰略高度,提出了一系列的大數據技術研發計劃,從而推動政府機構、學術界、相關行業和各類企業對大數據技術進行探索和研究。
可以說大數據是一種寶貴的戰略資源,其潛在價值和增長速度正在改變著人類的工作、生活和思維方式。可以想象,在未來,各行各業都會積極擁抱大數據,積極探索數據挖掘和分析的新技術、新方法,從而更好地利用大數據。當然,大數據并不能主宰一切。大數據雖然能夠發現“是什么”,卻不能說明“為什么”;大數據提供的是些描述性的信息,而創新還是需要人類自己來實現。
全網最全大數據教程
總結
以上是生活随笔為你收集整理的怎样理解大数据概念?大数据有什么用处?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: lisp把选集转成表_cad_lisp基
- 下一篇: 1.2 InSAR数据处理之软件介绍