Teradata大数据新动作:通过统一数据架构拥抱开源
ZDNET至頂網CIO與應用頻道 08月25日 綜合報道(文/丁慧茹):?之前我們在提到Teradata的大數據產品和方案時,必然要提到2011年被Teradata收購的Aster Data(現名Teradata Aster)。Teradata Aster在Teradata統一數據架構中承擔著數據分析和探索的重任。我們知道Teradata的大數據架構中最引以為傲的就是將數據倉庫、Aster以及Hadoop做了最好的整合,形成統一數據架構,并且在金融、電信等行業形成了非常成熟的行業應用案例。
在大中華區,Teradata在大數據方面有了更新的動作,Teradata Aster事業部也正式變更為Teradata大數據事業部,其承擔的是Teradata在大數據層面無論是技術還是應用方面的更新和拓展工作。
增加更多新功能 加快與Hadoop的整合
關于Teradata的統一數據架構(UDA)以及Aster在其中扮演的角色,在前兩年我們都做過很多介紹。在這個開放的數據分析平臺上,數據倉庫提供整個企業級的單一視圖、Aster承擔數據挖掘和探索平臺、Hadoop主要承擔文件存儲和ELT等功能。
至于Aster和Hadoop的區別,Teradata天睿公司大中華區大數據事業部總監孔宇華是這樣描述的:“Hadoop下面是文件存儲系統,上面用MapReduce做運算引擎。而Aster最大的不同是底層通過數據庫做存儲,上面有不同的運算引擎,諸如SQL、MapReduc、文本、關聯分析、圖像分析等。”同時,Aster提供業內使用最為廣泛的SQL接口。
Teradata天睿公司大中華區大數據事業部總監孔宇華
孔宇華強調,在Aster里面有各種分析工具,需要什么樣的工具就直接調用,而且不用轉移數據的存儲位置。
但是不能否認,Hadoop也體現出加速發展的趨勢,尤其是近一年來更新了眾多版本,并增加了各種新的功能模塊。在Teradata看來,開源社區對Hadoop的影響和貢獻很大,所以Teradata不會在這方面嘗試改變社區的發展方向。
“我們會盡量擁抱更多的開源產品,通過與HortonWorks合作,在Hadoop上面做開發。”孔宇華也指出,因為Storm和Spark開始成熟,可以實現一些流分析的應用,因此Teradata也會在這方面做相應的研究和應用。
同時,近期Teradata收購了兩家公司,其中Revelytix專長實現Hadoop上的元數據管理,而Hadapt更是能夠在Hadoop上基于SQL建立數據倉庫。“我們收購這兩家公司的人員資產和知識產權,這將擴展Teradata的大數據產品組合,增強Teradata統一數據架構功能。”孔宇華介紹到。
目前Teradata在推動Hadoop的應用其實都是基于統一數據架構,可以讓客戶更好地利用Hadoop和其他的大數據分析解決方案。“這些平臺應該是整合的,而不是孤立的,我們不希望每一個數據平臺,如Hadoop、數據倉庫、探索平臺和數據集市等是不同的獨立平臺,那樣企業就會形成數據孤島。”因此,在Teradata的統一數據架構里面還有一個工具就是QueryGrid,其可以整合和訪問分布在不同平臺的數據,做到更好的數據共享。
我們可以看到,今年Teradata在Hadoop方面做了很多的工作,也看到了Teradata大數據戰略中通過強化統一數據架構,擁抱快速發展的開源解決方案,幫助客戶獲得各種不同解決方案優勢。
此外,在今年7月份,Teradata在支持開源解決方案的重大突破就是實現Aster與R的整合。因此,在整個分析引擎中,除了SQL、MapReduce等之外,還增加了R。孔宇華說:“Aster與R的整合,是一個強強聯合,R上面有很多不同的算法、不同的分析函數的展示方法,可以通過Aster獲得分布式高性能計算。。”現在Aster這把瑞士軍刀將能夠幫助R語言分析師,通過開發的他們熟悉的R語言和工具,獲得強大的處理能力及豐富的分析方法。分析師還能夠從多個數據源訪問海量整合數據。
當然,Teradata對統一數據架構的功能更新和強化一直在繼續,無論是從數據獲取、存儲還是分析層面都加入了更多的功能。但是我們可以看到,Teradata在補充這些功能時,前提始終是基于這個“開放并包”的統一數據架構,而不是孤立的增加功能。
更多傳統行業成為目標客戶
前文我們提到了Teradata大數據功能和技術方面的新進展,而在行業應用方面,從與孔宇華的采訪中,也能感受到Teradata在一些傳統領域的“野心”。
以前提到Teradata的客戶時,我們可以數出一堆大金融企業、電信運營商,這些都是Teradata的優勢領域。而從前文的各種功能更新上也看到,其實Teradata在降低大數據分析的應用門檻,無論是與Hadoop的各種整合,還是與R的整合等,這其實在一定程度降低了更多的傳統企業應用大數據的技術門檻。
孔宇華在提到Teradata的統一數據架構的優勢時,也提到企業并不需要一次將所有的數據進行分析,而是可以將某一些數據快速地完成從獲取、存儲、探索到獲得價值這樣的一個流程,企業可以對數據的價值“先睹為快”,然后再決定自己的大數據戰略真正是怎樣的。
這也就是“大數據從小做起。”
而這樣一種思路必然會對Teradata進軍一些數據積累并不很好、IT技術并不是很強的行業產生推動作用。
在采訪孔宇華時,他提到Teradata的一些大數據成功案例時,聚焦在了三個領域,即醫療、零售和高科技制造業。據其透露,這三個領域也是之后Teradata在中國發力拓展的行業。
關于這三個行業的應用場景,孔宇華也做了一些舉例。比如醫療行業,可以針對同一病癥不同患者的治療周期和方法進行分析,以得出為何不同的患者的花費會有較大的差距。當然在醫療的應用場景并不是只有這么簡單,還有諸如區域醫療、臨床路徑等。
大數據在被提出來之時,很多人將目光放在了互聯網、金融、電信等行業,其實我們應該看到所有的行業都有著挖掘數據價值的愿望。而更多的傳統行業,一方面技術人才并不多,另一方面數據積累也并不完善,Teradata在大數據上的思路顯然照顧了這些行業的需求,更加追求易用和包容性,以讓更多的行業并不需要一開始大而全的做大數據,而是從小做起,一步步感受大數據的魅力和價值。
原文發布時間為:2014年08月25日 本文來自云棲社區合作伙伴至頂網,了解相關信息可以關注至頂網。總結
以上是生活随笔為你收集整理的Teradata大数据新动作:通过统一数据架构拥抱开源的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 常见的矩阵形式
- 下一篇: Ubuntu安装docker-ELK