热门IT资讯网

hadoop新特性通过NFSv3挂载HDFS到本地目录

发表于:2024-11-25 作者:热门IT资讯网编辑
编辑最后更新 2024年11月25日,原理NFS允许用户像访问本地文件系统一样访问远程文件系统,而将NFS引入HDFS后,用户可像读写本地文件一样读写HDFS上的文件,大大简化了HDFS使用,这是通过引入一个NFS gateway服务实现

原理

NFS允许用户像访问本地文件系统一样访问远程文件系统,而将NFS引入HDFS后,用户可像读写本地文件一样读写HDFS上的文件,大大简化了HDFS使用,这是通过引入一个NFS gateway服务实现的,该服务能将NFS协议转换为HDFS访问协议,具体如下图所示。



Portmap和Nfs3进程是成功启动hdfs nfs网关后才有的进程



HDFS NFS Gateway安装配置详解

http://blog.csdn.net/rzliuwei/article/details/38388279



启动NFS Gateway 服务

官网链接

http://hadoop.apache.org/docs/r2.4.1/hadoop-project-dist/hadoop-hdfs/HdfsNfsGateway.html



验证服务


如果不是可以查看/etc/exports文件





挂载HDFS


挂载HDFS文件系统到本地的/mnt/hdfs目录下

在NFS GATEWAY主机上输入

sudo mount -t nfs -o vers=3,proto=tcp,nolock 192.168.1.105:/ /mnt/hdfs


May 8 15:53:18 cdh2 rpc.mountd[3689]: refused mount request from 192.168.1.105 for / (/): unmatched host

如果报错因为机器默认没有打开NFSv3,修改/etc/sysconfig/nfs文件

把RPCNFSDARGS="-N 4"前面的#去掉(4兼容2和3),修改重启所有服务。



查看报错详细信息:
cat /var/log/messages|grep mount


成功挂载后如下所示,可以看到HDFS文件系统已挂载到本地目录


创建目录


可以看到HDFS系统上对应目录已创建成功


从本地上传文件到HDFS

文件大小为500m,测试性能

time cp /opt/cloudera-manager-el6-cm5.3.3_x86_64.tar.gz /mnt/hdfs/test


我的环境上耗时大概48s,10M/s的速度,还可以



解挂HDFS


报错umount.nfs: /mnt/hdfs: device is busy


fuser -m /mnt/hdfs,查看此文件系统正在被哪些进程访问


yum -y install lsof
查看此文件系统中正在被使用的文件,可以看到/data目录被正在使用

kill -9 15355 杀死访问进程就可以,输入umount /mnt/hdfs解挂成功。






补充:

linux下好用的命令:tree

安装tree包

yum -y install tree

安装后键入 tree /mnt/hdfs/hbase,目录结构以树形的方式显示是不是很直观



0