美柚上云 致力成为最懂女人的互联网企业
云棲號案例庫:【點擊查看更多上云案例】
不知道怎么上云?看云棲號案例庫,了解不同行業不同發展階段的上云方案,助力你上云決策!
案例背景
美柚以讓女人更美更健康為己任,致力成為最懂女人的互聯網企業;美柚很早就將大數據作為了解女人、讀懂女人、服務女人的最重要利器。大數據在美柚的應用非常廣泛,然而在美柚大數據之路的初期,遇到了不少的困難和挑戰:
- 平臺成本高:我們粗略的算過這筆賬,數加比我們自建的成本要節省30%左右。
- 擴展性不好:不僅需求提前預見新業務也需要預估資源的消耗量,從而提前申請足夠的資源,而數加則可以隨時購買所需的資源,甚至可以按量付費,完全不需要擔心資源不足的問題。
- 運維成本高:自建平臺需要自己去做很多的配套,例如權限控制、調度、監控、報警,當任務量和數據量到達一定程度時,復雜度成倍增加,不能很好的集中精力解決業務需求。
- 易用性:數加提供了數據血緣、任務依賴等實用功能,可以讓非數據開發人員(例如數據分析師)快速的找到自己想要的數據。
- 數據應用:提供機器學習算法平臺和推薦引擎大大降低了機器學習的門檻,不必關心代碼實現,只需要配置相關的參數即可。
關于美柚
廈門美柚信息科技有限公司,創始于2013年4月,是一家專注為女性服務的互聯網公司。秉承“讓女人更美更健康”的理念,美柚以經期管理為切入點,為女性提供備孕、懷孕、育兒、社區交流等功能服務。目前,美柚用戶超過1.5億,日活躍用戶近千萬,擁有約160個高活躍的女性話題圈,社區內用戶日均互動量超500萬帖,日均瀏覽量超過1.8億次。
在艾瑞、易觀、TalkingData、QuestMobile等第三方機構發布的研究報告均顯示,美柚在總用戶數、活躍用戶數、日均使用時間等關鍵指標方面遠遠領先于同類產品,是國內最大的女性健康管理應用,也是移動端最大的女性社區。
美柚大數據團隊在對內服務好美柚女性用戶的同時,積極舉辦和參與大數據技術沙龍, 同時參加各種國內重量級大數據峰會例如在阿里云棲大會上分享美柚的大數據架構和應用,影響和帶動廈門大數據圈。
挑戰
美柚以讓女人更美更健康為己任,致力成為最懂女人的互聯網企業;美柚很早就將大數據作為了解女人,讀懂女人,服務女人的最重要利器。這就要求我們大數據團隊需要做好數據治理這塊,將零散的日志和業務數據通過科學的方法,將其規整起來,形成合理易用的數據倉庫;只有做好數據倉庫,才能方便的提供各種數據服務。
為什么使用數加
美柚創始于2013年4月,而在2014年初就組建了大數據團隊。當時也是自建了一套大數據平臺,當時面臨最大的幾個問題:
- 人手不足,經驗不足:當時大數據開發團隊就3個人,而且還沒什么大數據開發經驗,對于hadoop及大數據生態等只是停留在理論階段,并沒有什么實操的經驗;
- 時間緊任務重:由于當時美柚處在高速發展的階段,對大數據的渴望異常強烈,然而大數據平臺處在建設的初期,各方面還不太完善,需要同時應付:數據平臺的建設,數據倉庫的建設,業務數據需求;
- 平臺不穩定:開源的hadoop系統并沒有完善的周邊配套,例如代碼版本控制,資源權限,任務調度,任務監控,失敗報警等功能,往往需要等早上發現數據沒出來,或數據有問題的時候再一步一步的排查問題,用戶體驗非常不好,經常遭到業務部門的投訴。
2014年底,美柚從阿里那邊請來了一個產品總監,了解到我們的大數據團隊的痛點之后,給我們推薦了數加。經過我們調研試用后感覺能夠解決我們的痛點,因此決定轉向數加平臺。
解決方案及架構
?
這是我們DMP的架構,目前數加主要是數據ETL以及數據的導入導出這塊。具體ETL的架構如下:
?
上圖的datax就是數加的數據集成部分
數據倉庫MaxCompute內部分層如下:
?
收益
- 幾乎零運維,極大的降低大數據的使用門檻。所有的代碼管理,調度,監控,報警數加都已經幫我們做好了,我們要做的就是使用它。這樣我們可以更專注于數據開發,專業的事要交給專業的人做。
- 數加的數據集成工具能夠很方便將不同的數據源的數據,進行導入導出,基本實現常用數據源的全覆蓋,從而實現大數據的全鏈路打通。
- 方法論的支持。我們遇到的一些問題,其實阿里云之前也遇到過,他們沉淀了一些解決問題的方法能夠讓我們有效快速的解決遇到的問題。
- 云棲大會和云棲社區上有不少解決實際問題的案例,也有不少新技術,新理念的介紹,能夠拓寬我們的視野。
云棲號案例庫:【點擊查看更多上云案例】
不知道怎么上云?看云棲號案例庫,了解不同行業不同發展階段的上云方案,助力你上云決策!
原文鏈接
本文為云棲社區原創內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的美柚上云 致力成为最懂女人的互联网企业的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2020将至,谈谈中小企业创业的那些事儿
- 下一篇: 小蜜团队万字长文 | 讲透对话管理模型最