预告:Intel、Hulu、阿里、京东、携程等大数据实战直播
前言:由CSDN主辦的SDCC?2017之大數據技術實戰線上峰會將在CSDN學院舉行。作為SD系列技術峰會的一部分,本次線上峰會秉承干貨實料(案例)的內容原則,將邀請圈內頂尖的布道師、技術專家和技術引領者,共話大數據平臺構建、優化提升大數據平臺的各項性能、Spark部署實踐、企業流平臺實踐、以及實現應用大數據支持業務創新發展等核心話題,旨在通過來自國內一線互聯網公司實踐案例,為開發者提供一個最有價值的高效的技術交流平臺!
主題:SDCC?2017之大數據技術實戰線上峰會
時間:10月14日 09:00 - 17:15
日前,大數據技術實戰線上峰會也公布了首批的講師和議題,接下來請看:
董西成 hulu
hulu大數據架構部門負責人董西成
個人介紹:?hulu大數據部門負責人,資深Hadoop技術實踐者和研究者,擁有超過8年的大數據平臺平臺研發經驗;《Hadoop技術內幕》系列叢書作者。
演講主題:?《Impala+AtScale:構建企業級OLAP引擎》
主題介紹:大數據時代因數據的多樣化和處理的復雜化,構建企業級OLAP引擎面臨諸多技術挑戰。盡管當前開源界提供了多種OLAP解決方案,但靈活性和性能方面均不能令人滿意。本次分享將介紹一種基于Impala和AtScale構建企業級OLAP引擎的方案,并進一步介紹了對Impala進行的源碼內核級優化。
聽眾收益:
-
大數據OLAP引擎的主流方案及優劣對比;
-
Impala+AtScale應用經驗及優化;
-
Impala源碼級優化。
許鵬 攜程
攜程機票高級研發經理許鵬
個人介紹:攜程機票大數據基礎平臺Leader,負責平臺的構建和運維。深度掌握各種大數據開源產品,如Spark、Presto及Elasticsearch。著有《Spark源碼剖析》一書。
演講主題:《攜程機票大數據基礎平臺架構演進》
主題介紹:攜程機票具有豐富的產品線,擁有海量數據,如何存儲、分析和應用這些數據一直是部門痛點所在。攜程機票大數據團隊結合部門業務實際,廣泛嘗試各種大數據開源產品,在不斷摸索中逐步形成穩定的大數據技術棧,該方案支持海量產線數據落地,亞秒級的實時分析和高效快速的交互式查詢,更在此基礎上結合業務提出了數據產品服務。
聽眾收益:
-
大數據解決方案;
-
開源產品的選型和運維;
-
大數據團隊的技術能力需求和人員組建;
-
大數據團隊和業務部門的結合。
張璐波 Intel
Intel大數據部門高級軟件工程師張璐波
個人介紹:目前就職于英特爾大數據部門,高級軟件工程師,上海交通大學碩士。之前主要進行網絡協議棧的研發工作,現專注于大數據平臺架構、Spark Streaming和SQL。
演講主題:《端到端、可擴展且高容錯性的Structured Streaming流式處理技術進階》
主題介紹:?Spark Structured Streaming 流式處理模塊作為Spark Streaming的改進版本,在Spark 2.0中引入并解決了以往流式處理在實際應用中遇到的一些問題,在實時數據處理方面發揮了重要作用。Structured Streaming是建立在Spark SQL引擎之上的端到端、可擴展且高容錯性的流式處理系統,你可以像進行批處理那樣進行流式表達式計算。
隨著數據的不斷到來,Spark SQL引擎會持續增量的進行計算并更新結果集。本次分享中,主要介紹Structured Streaming的一些基本概念和工作原理。
聽眾收益:了解Structured Streaming編程模型以及如何處理實時流中亂序以及延遲到達的數據,并對模塊高可用性進行細致的分析。
符鵬飛 永洪科技
永洪科技咨詢部咨詢總監符鵬飛
個人介紹:目前主要負責金融、制造行業數據咨詢工作,并成功推進光大銀行、民生銀行、中信銀行、美的集團、華為等眾多大型項目落地,同時兼任永洪數據科學研究院講師,為各行業數據分析愛好者提供數據分析、數據應用方面的培訓及指導工作。
演講主題:《數據技術的下一站——數據應用》
主題介紹:數據技術日漸成熟豐富,處理海量數據不再是企業的挑戰,但大多企業都不知數據該如何利用才能對業務和管理提升真正帶來價值。永洪基于自身的實踐和探索,找出了一條解決之道。
聽眾收益:
-
業務用戶:掌握數據分析技巧,開發百花齊放的數據應用;
-
管理層:如何通過數據應用驅動業務經營;
-
IT技術:如何搭建大數據應用分析架構,如何體現IT資產?
汪木鈴 螞蜂窩
螞蜂窩大數據平臺負責人汪木鈴
個人介紹:?2014年至今負責螞蜂窩數據采集、對接、數據產品的開發及整個大數據平臺的架構設計、技術選型,專注于大數據工具鏈的定制開發及應用。
演講主題:《螞蜂窩大數據平臺架構演進》
主題介紹:本次分享主要涉及螞蜂窩大數據平臺的架構設計、離線數據探索、實時數據探索、多維數據分析中Druid引擎引入的背景和帶來的價值。
聽眾收益:
-
如何做離線數據探索;
-
如何做實時數據探索;
-
如何做多維度數據分析。
陳守元 阿里
阿里集團計算平臺事業部產品專家陳守元
個人介紹:阿里集團計算平臺事業部產品專家,7年大數據工作經驗,曾負責異構數據同步工具DataX產品和架構設計、阿里云流計算產品設計。
演講主題:《阿里集團實時流計算平臺Blink在阿里集團的應用實踐》
主題介紹:本次分享將從阿里集團的大數據處理現狀講起,引出實時流計算在阿里集團幾個典型應用,包括雙十一大屏、ABTest、機器學習。阿里為應對超大規模海量數據,在Flink上面做了諸多技術優化,包括Yarn Scheduler Optimization、Incremental Checkpoint、ASynchronize IO。為了進一步實現實時流平臺產品化,阿里集團為社區貢獻了包括StreamSQL等核心功能。在集團內部,Blink提供了一站式流式SQL開發平臺和拖拽式的在線機器學習平臺,演講中也會進行講解。
主題介紹:
-
用戶了解流計算在阿里集團的應用案例;
-
用戶了解當前阿里集團在Flink上的重點技術/產品投入點;
-
用戶了解阿里集團內部對于流計算的產品化。
王哲涵 京東
京東大數據平臺數據架構部架構師王哲涵
個人介紹:?2015年加入京東,期間在大數據平臺研發部工作,目前負責京東大數據平臺的架構與研發工作。
演講主題:《Presto的服務治理與架構優化及在京東的實踐與應用》
主題介紹:?Presto是大數據adhoc查詢的利器,京東對于Presto有較大封裝及改造, 將其管理、部署、監控及自愈升級自動化,同時在性能上有大膽的創新嘗試,對支撐高并發和緩存查詢有較深的研究。
聽眾收益:?Presto的服務治理與架構優化。
如何報名?點擊【閱讀原文】立即報名!(還可以掃碼入群哦)
群滿請到報名頁查看
總結
以上是生活随笔為你收集整理的预告:Intel、Hulu、阿里、京东、携程等大数据实战直播的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 豆腐汤家常做法?
- 下一篇: call apply bind原理刨析及