當前位置：首頁 > 运维知识 > linux >内容正文

linux

wordcount linux java_linux下在eclipse上运行hadoop自带例子wordcount

發(fā)布時間：2025/3/8 linux 19 豆豆

生活随笔收集整理的這篇文章主要介紹了 wordcount linux java_linux下在eclipse上运行hadoop自带例子wordcount 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

啟動eclipse：打開windows->open perspective->other->map/reduce 可以看到map/reduce開發(fā)視圖。設(shè)置Hadoop location.

打開windows->show view->other-> map/reduce Locations視圖，在點擊大象后【new Hadoop location】彈出的對話框(General tab)進行參數(shù)的添加：

Location name: 任意

map/reduce master：?與mapred-site.xml里面mapred.job.tracker設(shè)置一致。

DFS master：與core-site.xml里fs.default.name設(shè)置一致。

User name: 服務(wù)器上運行hadoop服務(wù)的用戶名。

這些已經(jīng)足夠用。當然，如果你需要特殊設(shè)置，那么打開Advanced parameters設(shè)置面板，查看當前的選項以及修改其值.

創(chuàng)建Map/Reduce Project。運行最簡單的WordCount程序。

點擊Run on hadoop, 運行程序。你可以看到在output文件夾中出現(xiàn)文本段

運行時可能會出現(xiàn)內(nèi)存溢出的異常：

原因是客戶端程序運行時java虛擬機內(nèi)存分配不夠，修改run configuration(run as >run configurations)，選擇Arguments選項卡，在VM arguments欄中加入-Xmx1024m，保存后執(zhí)行沒有問題(即將執(zhí)行時虛擬機內(nèi)存調(diào)大)

在eclipse中運行wordcount.java,比在終端運行要簡單，首先su進入超級賬戶，運行eclipse，這里首先要確保eclipse的hadoop插件已經(jīng)成功安裝。hadoop啟動，將eclipse中的dfs系統(tǒng)配置后，在eclipse頁面的左側(cè)dfs處刷新，新建文件夾input，upload想要測試的文件，然后在run->run as->run configration中配置參數(shù)，在argument選項卡中配置wordcount的參數(shù)，即測試文件和輸出文件夾的位置，中間用空格隔開，本人是如此配置的，hdfs://localhost:8020/user/root/input hdfs://localhost:8020/user/root/output，點擊run，運行完畢后在output文件夾中查看結(jié)果。

總結(jié)

以上是生活随笔為你收集整理的wordcount linux java_linux下在eclipse上运行hadoop自带例子wordcount的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。