专访 | 神策数据CEO桑文锋:谁说大数据不需要「小而美」
從前任百度大數據部門的技術經理,到今天神策數據CEO,9年時間,桑文鋒身上發生了許多變化。他笑稱,這種變化從他的微信好友數量就能看出來。創業之前,他只有200多個好友,現在已經迅速逼近5000人的上限。
大數據行業9年的歷程帶給他很多挑戰,也改變了他的很多看法,但讓他對自己所選擇的道路愈加堅定了。前不久,神策數據拿到了400萬美元的A輪融資,桑文鋒與他團隊的堅持得到了認可。
近期,CDA約訪到了桑文鋒先生,聽他聊聊他對大數據行業的看法。
下文根據采訪實錄整理:
桑文鋒神策數據CEO“CDA:大數據領域的創業公司日漸增多,您怎么看待目前市場中的機遇和挑戰?
桑文鋒:我自2007年從浙江大學研究生畢業之后進入百度,一開始在百度知道做研發工作,第二年就開始做數據領域的工作。
百度推崇用數據說話,它本身的數據規模也比較大,懂數據,對數據也比較重視。從2008年開始,我負責一個小團隊,基于Hadoop搭建了一些數據處理平臺,主要用來處理百度的產品數據,比如它的用戶量、訪問量等等。
那個時候沒有大數據的概念,大家談論的都是云計算。到2011年、2012年左右,大數據的概念就比較火了,當時意識到大數據技術很有價值,但是數據基本都集中在BAT。
最近三四年業內比較大,主要表現在:
一是移動互聯網的發展,傳感器的發展,讓以前收集不到的數據現在可以收集到了,線下的行為轉移到線上,這讓一些規模比較小的公司也能夠獲取數據;
二是大數據處理的軟硬件基礎在不斷成熟,摩爾定律,機器越來越便宜,性能越來越高,像Hadoop這種基礎的大數據處理平臺越來越成熟,很容易搭建并使用;
三是,雖然前幾年大數據不乏炒作概念之嫌,但也有一點好處,就是提高了人們對于數據的重視程度,你不用再跟對方科普數據有多重要了,他已經開始自覺地關注如何讓數據發揮更大的價值。
在這種大環境下,大數據技術能夠在很多領域被很多企業利用。而我最終出來創業,其實賭了兩個潮流:一個是創業潮,國家鼓勵創業,重視創業,創業公司的數量不斷增多,代表著企業對于數據的潛在需求越來越大。另外一個是互聯網+,許多傳統企業面臨轉型,從線下轉到線上,轉型過程中必定也會產生數據的需求。吳軍在他的《浪潮之巔》中提到,科技領域的發展趨勢就是一波波浪潮,跟著浪潮走會更容易把事情做成。目前互聯網創業的浪潮能夠推動我們去發現和把握時機。
桑文鋒:數據分析不是一個新概念,早些年就已經有不少公司在這個領域發力,覆蓋的用戶量也很高。目前市場上的部分數據分析產品有優點,也存在著問題。好處在于一是簡單免費,不足的地方在于數據采集能力比較弱,一般只能采集客戶端的數據,服務端、數據庫的數據不多,這就會影響后期的分析;第二點在分析能力,一般做宏觀分析都沒有問題,比較難實現的是多維度的交叉分析;第三點是數據安全,用戶會對數據存儲產生安全顧慮。
神策數據的定位是針對互聯網公司的用戶行為分析。有這么幾個特點:
第一,提供私有化部署,用戶可以把他需要的服務部署到自己的服務器上,數據不會出他自己的環境,打消了他們的安全顧慮。
第二,強調全端數據接入。不管是客戶端的數據,還是服務端數據庫的數據都可以接入,提供可視化埋點、代碼埋點、工具導入等等,有了數據才能更好地分析。
第三,神策基于PaaS平臺,一般比較常用的是SaaS服務,二者的區別在于SaaS很難進行二次開發和深度利用,它不提供接口,你也很難建模,而用戶在PaaS平臺可以進行二次開發和存儲利用。從數據采集、存儲、建模分析到可視化,用PaaS平臺可以做到每一個環節對用戶開放,把數據讀取出來,進行深度利用。用Hadoop、Spark搭建的大數據框架也可以直接訪問。
另外,用戶的每一個行為就是一個事件,比如提交訂單,瀏覽網頁,可以理解為一系列事件。我們的平臺可以自定義用戶的事件以及事件相關的維度。要分析的產品各不相同,但事件的本質是一樣的,我們有靈活的機制去適配。所以,所有的用戶只需要用同一個數據分析平臺就可以滿足需求,沒有太多定制化的東西,節省了很大成本。
大數據的概念很寬泛,專注于某一個領域更容易成功。比如我們專注于用戶行為分析,把這一個點做好就可以了,如果泛泛地什么都去嘗試,反而不能夠垂直深入。
2015年是大數據落地的一個年份,前兩年雖然有很多人在炒概念,但近期出現的數據公司都開始從某一個點切入,這是一種更務實更科學的方式。可能將來會出現行業的整合,但是目前那些小而精、小而美的產品存活下來的機會比較大。
很多人傾向于在現階段要掌握數據,怎么能拿到數據怎么干,但我認為這種思路背離了以用戶為中心的理念。不能只想著自己掌握數據,更重要的是要知道用戶真正需要什么。所以我認為大數據本身發展大概會分成兩個階段:第一個階段是能力階段,第二個階段是價值階段。現在大家知道數據很重要,但是不知道怎么做,你要提供好的數據分析工具,讓他有能力做,這是第一個階段。這個階段過后,工具普及了,人們更關注怎么從數據中挖掘更多的價值,這是第二個階段。
桑文鋒:不能把數據太神話了,一定要結合業務看待。我們最早從電商類的企業切入,因為對電商類的企業而言數據最關鍵,每一種商品的瀏覽情況、下單情況,用戶的轉化情況,每一種數據都直接與它的業務相關。在我們看來跟訂單與交易相關的數據價值會更明顯一些。比如,你去投放廣告,你去衡量在不同平臺投放廣告的效果如何,就要去對比不同渠道轉化的付費用戶的比例有多少,平均客單價有多高、復購情況如何,只有經過這些分析,你才能知道不同廣告平臺的價值區別在哪里,就可以從拍腦袋的方式轉化到數據驅動的方式。
現階段對于創業公司來說,數據采集是比較難的。一方面是不知道怎么采集數據,另一方面是不知道應該采集哪些數據,更不知道怎樣把這些數據建模。所以我們一方面提供全端接入的模式,一方面也建立了數據分析團隊,幫助用戶理清思路,梳理維度,讓他們比較容易得落地;另外就是數據分析的理念問題,很多用戶不知道怎么做數據分析,那么我們在產品之外還需要灌輸理念,做一些科普的工作。這方面也是個坎,但是在過個三五年,數據驅動增長的理念應該就能夠更廣泛地被接受。
(小編插播:桑文鋒先生將在CDAS2016中國數據分析師行業峰會上繼續深入探討這個問題,敬請期待!移步閱讀原文即可報名)
桑文鋒:大數據不是聽一兩次課或者看一兩本書就能摸清楚的,還是需要有實踐經驗,比如說我之所以對大數據有信心,就是在百度的那幾年接觸過各種技術,知道各種場景應該怎樣做處理,你本身要有機會去處理一些數據相關的問題。如果想做數據工程師,就以開發平臺架構已出發點,多去尋找這樣的機會,對于分析師來說,則要首先培養自己數據驅動的理念,基于這種理念去做分析,自然能力就提升了。
對于大數據分析師這個崗位,我可以推薦一本書叫《精益數據分析》,主要講互聯網公司是如何做數據分析的。其實大數據分析的分析方法不難,難的是如何基于業務場景靈活運用,所以要先構建理念。這本書在應用上可以給你一些啟發。也不要把自己局限于分析工作,多了解業務。
文章來源:CDA數據分析師
總結
以上是生活随笔為你收集整理的专访 | 神策数据CEO桑文锋:谁说大数据不需要「小而美」的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 译文| 相信指标还是相信经验?
- 下一篇: Worktile:DNA中带有“效率”精