大数据的学习路线
大數據的本質:
? ? ? ? ? ? ? ? ? ?數據的儲存。
? ? ? ? ? ? ? ? ? ?數據的計算。
學習路線:
(1)java基礎和linux基礎。
(2)hadoop的學習:體系結構、原理、編程。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?第一階段:HDFS(儲存)、MapReduce(計算)、HBase(NoSQL數據庫)。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?第二階段:數據分析引擎=========>Hive、pig。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?數據采集引擎=========>Flume、sqoop。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?第三階段:HUE? ?: web管理工具
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Zookeeper:實現hadoop的HA。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? Oozie:工作流引擎。
(3)Spark的學習:
?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?第一階段:Scala編程語言。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第二階段:Spark Core=========>基于內存、數據的計算。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第三階段:Spark SQL=========>類似于mysql中的sql語言。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 第四階段:Spark Streaming=========>進行實時計算。
(3)Apache Streaming:=========>進行實時計算。
?
總結
- 上一篇: 最新两个字的个性游戏网名92个
- 下一篇: NTP时间同步服务器设置