zeppelin的安装与使用
想起馬上就能回家了,心情是按捺不住的激動,唉,還是繼續努力吧,其實不希望那么快就回家,感覺回去了就意味著馬上就要回來了,人真的是神奇呀
今天我們來使用zeppelin,這個就是可以把我們查找的數據可以圖形化的方式顯示出來,好了,今天開始我們的任務吧
1.首先我們要下載zeppelin的壓縮包,當我們解壓之后(這一臺主機上面已經安裝過了java的環境)
2.修改配置環境
進入conf/
將zeppelin-env.sh.template修改為zeppelin-env.sh
將zeppelin-site.xml.template修改為zeppelin-site.xml
然后我們接下來修改conf/zeppelin-env.sh新增
export SPARK_MASTER_IP=192.168.109.136
export SPARK_LOCAL_IP=192.168.109.136
3.啟動zeppelin
進入zeppelin:進入bin目錄下執行./zeppelin-daemon.sh start
然后瀏覽器訪問192.168.109.136:8080進入界面
此時就啟動成功
4.zeppelin簡單實用
1.text
2.html
3.table
5.可以對數據進行分析
對于我做的最多的分析,就是基于學校的那個資料,我有學校里面的信息,這個里面的每一行的信息是以","
進行分隔,這個其中里面的民族,此時我們對這個民族進行分析
由于我們這個zeppelin是在linux里面的啟動,所以我們必須把原有的數據放到linux的里面,此時zeppelin讀的文件目錄是linux里面的目錄
則此時我們就可以對數據庫里面的東西進行視圖分析,我們通過這個數據,我們發現通過讀取數據
,以分組的方式,然后在查詢數據有多少個,這樣就可以對數據進行顯示
a.
val text = sc.textFile("/tmp/xjdx.txt") case class Person(college:String,time:Integer) val rdd1 = text.map(line =>{val fields = line.split(",")if(fields.length >=10){val mz = fields(10)Person(mz,1)}else{Person("1",1)} })b.
rdd1.toDF().registerTempTable("rdd1")c.
%sql select college,count(1) from rdd1 group by college這個里面只是針對于存儲介質是文件的形式,對于數據庫的那個有問題,我會在以后的章節繼續介紹的,敬請期待
轉載于:https://www.cnblogs.com/wnbahmbb/p/6291599.html
總結
以上是生活随笔為你收集整理的zeppelin的安装与使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java并发编程实战 第14章 构建自定
- 下一篇: HihoCoder 1323 回文字符串