Databricks:打造数据国度的“金砖四国”
Databricks,一個并不算熟悉的名字,是大數據國度的后起之星。成立不夠一年,但卻陣容強大,創始人都是開源圈子里面的重要級人物,值得關注。從公司名Databricks似乎就能看出一些深意——data(數據)+bricks(金磚四國)。不知道,在數據國度里Databricks是否具有“金磚四國”的發展前景呢?
可以先從公司的創始背景談起,打開Databricks官網,“We're working to revolutionize what you can do with big data“映入眼簾。其格外簡約不能再簡約,可以用清新的字眼來描述網站來看,這一行字相信解讀為公司創立的最初想法和終極目標似乎不為過。
Databricks是由Apache Spark的創始人建立的,成立于2013年年中,公司重于研發尖端系統,以從大數據中獲取價值。Databricks認為大數據仍存在很大部分尚未開發的機遇,這也就是他們所要做的,通過改革來尋找到底大數據可以幫助人們做些什么。
?
加州大學伯克利分校,攝于2013年
也許正是基于此背景,Databricks目前的陣容對于大數據領域來說有不少亮點。團隊人員均是開源圈子內的重量級人物,他們都熱衷于“增值開源軟件”:任職CEO 的Ion Stoica是UC Berkeley計算機教授、AMPLab聯合創始人,同時也是Conviva公司的聯合創始人(位于后排右三);CTO Matei Zaharia 是Apache Spark的創作者,同時也是麻省理工學院計算機科學系的助理教授(位于后排左三);UC Berkeley計算機科學教授Scott Shenker。同時也是知名SDN公司Nicira的聯合創始人及前CEO(位于后排右二);值得一提的是聯合創始人辛湜先生(英文名Reynold Xin,新浪微博為@hashjoin)還是一名中國人,無疑會帶給Databricks公司多一分的中國色彩,他同時也是Spark的核心成員(位于前排左二)。
對于這家新興的大數據公司,最好奇的就是他所擁有的大數據產品到底是什么呢?可以這么說,如果將Databricks公司的產品說成是Spark社區,其實不如說Databricks主要服務于Spark。這一點我們從其團隊的主要成員不難看出。按照辛湜先生在媒體訪問中所說,Databricks的目標是從Spark開始,構建一系列更強大、更簡單的大數據分析處理工具盒平臺。
不錯,從其對外公布的官方博客中,這一點也得到了印證。3月18日宣布Databricks“認證Spark”項目主要用于那些建立在Apache Spark平臺頂部上的應用,其實就是確保被認證的應用與許多Spark發行的商業支持一起使用。Databricks CEO Ion Stoica表示在此次項目中,Databricks將處理與認證的Apache在各商業版本中的兼容性任務,并能夠很快確定其初始設置的分派是否滿足此條件。
這里,可以順便一起回顧下Apache Spark,它是一個開源數據處理引擎,用于構建高效率的、易用的和復雜分析的Hadoop數據,最初是成立于2009年的加州大學伯克利分校(UC Berkeley)AMPLab,正式開源是在2010年。正如Apache Spark做到100%的開源,Databricks也依舊遵循此規則。目前Spark已經發展成為大數據領域最大的開發者社區,有超過來自30個組織的100多個貢獻者。不得不說注入如此基因的Databricks,絕對會更“親民”。
迄今為止,這家極盡低調的公司Databricks,可以用神秘的大數據公司來形容。但在其成立不到一年的時間內,還是獲得了Andreessen Horowitz 1400萬美元投資。Andreessen Horowitz曾先后投資了Groupon、Skype、Zynga、Foursquare和Facebook等著名的互聯網公司,外媒BusinessInsider曾將他譽為硅谷最具權威的50個天使投資人之一。
同時,Databricks還有個同樣在大數據領域不容小覷的合作伙伴。從去年(2013年)Hadoop World會議上,就爆出Cloudera決定提供Apache?Spark的全企業級支持,這也就意味著Databricks將成為Cloudera的第一個合作伙伴。Cloudera最近也是新聞不斷,剛斬獲了1.6億美元 的融資,上市消息不斷傳出。
合作方式主要是Databricks幫助Cloudera提供支持,雖然目前Databricks僅以類似OEM的關系獲益,該協議僅限于擴展Apache Spark,不會發布任何商業版本的Databricks。但正如Cloudera公司聯合創始人兼CTO Amr Awadallah所說,此次合作將是作為Cloudera所有感興趣的客戶創新的樞紐,無疑這將為這家新興創業公司贏得業界內的信譽。
此外,Databricks對于中國市場也很是看重,從主要創始人多次參加相關活動足以看出。近期就有一個機會,期待的伙伴們或許可以親臨現場。本月19日Databricks受邀參加“2014中國Spark技術峰會”(Spark Summit China 2014),屆時期待Databricks公司成員Andy Konwinski的發言。
溫馨提示:想要快速了解Databricks的網友,可火速點擊http://stor-age.zdnet.com.cn/special/big_data_Databricks
原文發布時間為:2014年04月08日 本文作者:林利 本文來自云棲社區合作伙伴至頂網,了解相關信息可以關注至頂網。總結
以上是生活随笔為你收集整理的Databricks:打造数据国度的“金砖四国”的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 前端笔记1 HTML基础
- 下一篇: 水下SLAM论文!!!