大数据平台/大数据技术与原理 您所在的位置:网站首页 数据文件读写实验报告 大数据平台/大数据技术与原理

大数据平台/大数据技术与原理

2024-06-29 05:42| 来源: 网络整理| 查看: 265

实验内容(实验原理、运用的理论知识、算法、程序、步骤和方法)

1.启动全分布模式Hadoop集群,守护进程包括NameNode、DataNode、SecondaryNameNode、ResourceManager、NodeManager和JobHistoryServer。

此时使用jps查看各个节点端口的启用情况:

主节点:

从节点:

2.查看HDFS Web界面。

3.练习HDFS Shell文件系统命令和系统管理命令。

查看文件目录:

hdfs dfs -ls

上传文件:

hdfs dfs -put

这个命令可以将本地文件上传到HDFS1。

下载文件:

hdfs dfs -get

这个命令可以将HDFS的文件下载到本地1。

创建目录:

hdfs dfs -mkdir

这个命令可以在HDFS中创建新的目录1。

删除文件:

hdfs dfs -rm

这个命令可以删除HDFS中的文件1。

查看安全模式状态:

hdfs dfsadmin -safemode get

这个命令可以查看HDFS的安全模式状态

以上就是一些基本的HDFS Shell命令,你可以通过这些命令来操作HDFS文件系统。

4.在Hadoop集群主节点上搭建HDFS开发环境Eclipse。

5.使用HDFS Java API编写HDFS文件操作程序,实现上传本地文件到HDFS的功能,采用本地执行和集群执行的两种执行方式测试,观察结果。

6.使用HDFS Java API编写HDFS文件操作程序,实现查看上传文件在HDFS集群中位置的功能,采用本地执行和集群执行的两种执行方式测试,观察结果。

   单击Eclipse工具栏中的Run按钮,直接运行UploadFile,执行结果如图2-32所示。从图2-32中可以看出,在/root/eclipse-workspace/HDFSExample目录下增加一个“file1.txt”文件,本地文件系统发生的变化如图2-33所示,file1.txt没有上传到HDFS上,使用命令“hadoop fs -ls /”查看不到file1.txt。

   此时进行传送到hadoop的集群上进行处理:

此时登录webUI界面:

此时可以看到的是file1.txt文件已经上传上去了

7. 关闭全分布模式Hadoop集群。

    关闭全分布模式Hadoop集群的命令与启动命令次序相反,只需在主节点master上依次执行以下3条命令即可关闭Hadoop。

   mr-jobhistory-daemon.sh stop historyserver

   stop-yarn.sh

   stop-dfs.sh

   执行mr-jobhistory-daemon.sh stop historyserver时,其*historyserver.pid文件消失;执行stop-yarn.sh时,*resourcemanager.pid和*nodemanager.pid文件依次消失;stop-dfs.sh,*namenode.pid、*datanode.pid、*secondarynamenode.pid文件依次消失。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有