centos7装单机hadoop2.7.3
(1)hadoop2.7.3下載
(前提:先安裝java環境)
下載地址:http://hadoop.apache.org/releases.html
(注意是binary文件,source那個是源碼)
(2)解壓tar.gz
(3)配置hadoop
1.修改/usr/hadoop/hadoop-2.7.3/etc/hadoop/hadoop-env.sh 文件的java環境,將java安裝路徑加進去:
export JAVA_HOME=/alidata/server/java-1.7.0
配置hadoop環境變量
vi /etc/profile
export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin
有的安裝介紹中說是vi ~/.bash_profile,其實也可以用這個,2個命令在不同系統用戶的環境配置的作用域不一樣。參考:
http://blog.csdn.net/caiwenfeng_for_23/article/details/44242961
使之生效:
source /etc/profile
2.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/core-site.xml 文件,
<configuration>
??? <!-- 指定HDFS老大(namenode)的通信地址 -->
??? <property>
??????? <name>fs.defaultFS</name>
??????? <value>hdfs://localhost:9000</value>
??? </property>
??? <!-- 指定hadoop運行時產生文件的存儲路徑 -->
??? <property>
??????? <name>hadoop.tmp.dir</name>
??????? <value>/usr/hadoop/tmp</value>
??? </property>
</configuration>
fs.defaultFS直接用localhost就行,如果重命名了主機名,也可以用重命名的。
3.修改/usr/hadoop/hadoop2.7.3/etc/hadoop/hdfs-site.xml
<configuration>
??? <property>
?? ??? ?<name>dfs.name.dir</name>
?? ??? ?<value>/usr/hadoop/hdfs/name</value>
?? ??? ?<description>namenode上存儲hdfs名字空間元數據 </description>
??? </property>
??? <property>
??????? <name>dfs.data.dir</name>
??????? <value>/usr/hadoop/hdfs/data</value>
??????? <description>datanode上數據塊的物理存儲位置</description>
??? </property>
??? <!-- 設置hdfs副本數量 -->
??? <property>
??????? <name>dfs.replication</name>
??????? <value>1</value>
??? </property>
</configuration>
4.SSH免密碼登錄
ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys
5.hdfs啟動與停止
第一次啟動hdfs需要格式化,之后啟動就不需要的:
cd /usr/hadoop/hadoop-2.7.3
./bin/hdfs namenode -format
啟動命令:
./sbin/start-dfs.sh
停止命令:
./sbin/stop-dfs.sh
從圖中看,會啟動namenode,datanode,secondarynamenode
瀏覽器輸入:http://119.29.174.43:50070???? 查看效果:
6.接下來配置yarn文件. 配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/mapred-site.xml??? 。這里注意一下,hadoop里面默認是mapred-site.xml.template 文件,如果配置yarn,把mapred-site.xml.template?? 重命名為mapred-site.xml 。如果不啟動yarn,把重命名還原。
mv mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
<configuration>
??? <!-- 通知框架MR使用YARN -->
??? <property>
??????? <name>mapreduce.framework.name</name>
??????? <value>yarn</value>
??? </property>
</configuration>
7.配置/usr/hadoop/hadoop-2.7.3/etc/hadoop/yarn-site.xml文件,
<configuration>
??? <!-- reducer取數據的方式是mapreduce_shuffle -->
??? <property>
??????? <name>yarn.nodemanager.aux-services</name>
??????? <value>mapreduce_shuffle</value>
??? </property>
</configuration>
8.啟動yarn
啟動:
./sbin/start-yarn.sh
停止:
./sbin/stop-yarn.sh
如圖:
會啟動resourcemanager,nodemanager
可以用jps命令查看啟動了什么進程:
瀏覽器輸入:http://119.29.174.43:8088????? (8088是默認端口,如果端口占用,先把占用的端口殺掉 netstat -ano)
這樣,dfs和yarn就啟動成功了。
轉載于:https://www.cnblogs.com/huifeidezhuzai/p/10011660.html
總結
以上是生活随笔為你收集整理的centos7装单机hadoop2.7.3的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: JDK8与JDK11
- 下一篇: 广西(柳州)创建国家级车联网先导区建设方