hdfs删除文件夹|如何删除hdfs文件-山九号

『壹』如何删除Hadoop

rm -rf 目录名就可以了

『贰』如何恢复hadoop中被删除的文件

如何恢复Hadoop中被删除的文件hadoop的hdfs中被删除文件的恢复原理和回收站原理是一样的，就是在删除hdfs文件时，被删除的文件被移动到了hdfs的.Trash文件夹中，恢复时只需将该文件夹中文件拿出即可。具体操作如下： 1 设置.Trash文件夹如果需要恢复hdfs中文件，就需要设置.Trash，hadoop的.Trash默认是关闭的。具体设置如下： <property> <name>fs.trash.interval</name> <value>10080</value> </property> 该配置项在core-site.xml中，fs.trash.interval代表删除的文件保留的时间，时间单位为分钟，默认为0代表不保存删除的文件。我们只需要设置该时间即可打开.Trash。 2 设置后删除文件会显示删除的文件被移动到了hdfs://192.168.1.100:9000/user/hadoop/.Trash/Current中，举例如下： 14/10/20 16:48:24 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 10080 minutes, Emptier interval = 0 minutes.

『叁』 Hadoop程序中怎样用代码删除hafs中的文件和目录

CYD同学的Hadoop使用心得和大家分享下使用hadoop的map/rece进行分布式运算已经有一段时间了，谈下自己的心得，纯粹是自己的感受，欢迎拍砖。首先是部署，在linux下的部署非常简单，随便在网上找个攻略就能搞定。关键是如何配置一个调试环境。在实验室，我是用ubuntu，直接在图形界面下用eclipse，非常方便。考虑到很多时候，linux没有图形界面，比如淘宝这种在windows下用xshell登陆开发机的情况，有必要在windows下模拟一个

『肆』如何删除每次运行hadoop命令的时输出目录

启动Hadoop进入HADOOP_HOME目录。执行sh bin/start-all.sh关闭Hadoop进入HADOOP_HOME目录。执行sh bin/stop-all.sh 1、查看指定目录下内容hadoop dfs –ls [文件目录]eg: hadoop dfs –ls /user/wangkai.pt2、打开某个已存在文件hadoop dfs –cat [file_path]eg:hadoop dfs -cat /user/wangkai.pt/data.txt3、将本地文件存储至hadoophadoop fs –put [本地地址] [hadoop目录]hadoop fs –put /home/t/file.txt /user/t (file.txt是文件名)4、将本地文件夹存储至hadoophadoop fs –put [本地目录] [hadoop目录] hadoop fs –put /home/t/dir_name /user/t(dir_name是文件夹名)5、将hadoop上某个文件down至本地已有目录下hadoop fs -get [文件目录] [本地目录]hadoop fs –get /user/t/ok.txt /home/t6、删除hadoop上指定文件hadoop fs –rm [文件地址]hadoop fs –rm /user/t/ok.txt7、删除hadoop上指定文件夹（包含子目录等）hadoop fs –rm [目录地址]hadoop fs –rmr /user/t8、在hadoop指定目录内创建新目录hadoop fs –mkdir /user/t9、在hadoop指定目录下新建一个空文件使用touchz命令：hadoop fs -touchz /user/new.txt10、将hadoop上某个文件重命名使用mv命令：hadoop fs –mv /user/test.txt /user/ok.txt （将test.txt重命名为ok.txt）11、将hadoop指定目录下所有内容保存为一个文件，同时down至本地hadoop dfs –getmerge /user /home/t12、将正在运行的hadoop作业kill掉hadoop job –kill [job-id]

『伍』怎么删除home文件夹下的hadoop文件夹

命令：hadoop fs -rmr /home/mm/lily2(要求是你把hadoop的bin加到PATH中，并开启hadoop)rm -rf /home/mm/lily2（这是删除linux文件系统的文件夹）

『陆』如何在spark中删除hdfs的某个文件夹

hadoop 添加删除datanode及tasktracker 首先：建议datanode和tasktracker分开写独立的exclude文件，因为一个节点即可以同时是datanode和tasktracker，也可以单独是datanode或tasktracker。 1、删除datanode 修改namenode上的hdfs-site.xml <property><name>dfs.hosts</name><value>/usr/local/hadoop/conf/datanode-allow-list</value></property> <property><name>dfs.hosts.exclude</name><value>/usr/local/hadoop/conf/datanode-deny-list</value></property>其中dfs.host列出了连入namenode的节点，如果为空，则所有的datanode都可以连入namenode。如果不为空，则文件中存在的datanode可以连入。 dfs.hosts.exclude列出了禁止连入namenode的节点。如果一个节点同时存在于dfs.hosts和dfs.hosts.exclude，则禁止连入。具体步骤（1）将要删除的datanode加入到dfs.hosts.exclude指定的文件中。（最好使用主机名，IP有时可能不生效）（2）动态刷新配置，不需要重启namenode hadoop dfsadmin -refreshNodes（3）通过hadoop dfsadmin -report或webui，可以看到，该datanode的状态为Decommissioning （4）等待一段时间，该节点为dead状态。（5）删除dfs.hosts文件中该节点即下架目标机器后，再次编辑dfs.hosts.exclude，把刚才下架的机器的ip或机器名移走（6） hadoop dfsadmin -refreshNodes注：按照上面的操作后，如果你想要重新启用该节点为datanode，从dfs.hosts.exclude中删除该节点，refreshNodes，然后，到该节点上，重启启动该datanode： /usr/local/hadoop/bin/hadoop-daemon.sh stop datanode/usr/local/hadoop/bin/hadoop-daemon.sh start datanode注:正确的删除datanode的方法应该是按照上面的方法，使用exclude文件，而不应该直接去datanode上去sotp datanode，这样会造出数据丢失，而且stop以后，webui和hadoop dfsadmin -report都仍然显示该datanode节点。除非重新启动namenode。之所以重新启用exclude的节点时可以stop datanode，因为此时该datanode不包含在cluster中，所以，stop后不会造成数据丢失。 2、添加datanode 如果存在dfs.hosts文件，且不为空，则添加新的datanode到该文件中，refreshNodes。到新节点上，启动即可 /usr/local/hadoop/bin/hadoop-daemon.sh start datanode如果不存在dfs.hosts文件，或文件为空，直接启动新节点即可。 3、删除tasktracker 原理和步骤与删除datanode一样。 <property><name>mapred.hosts</name><value>/usr/local/hadoop/conf/tasktracker-allow-list</value></property> <property><name>mapred.hosts.exclude</name><value>/usr/local/hadoop/conf/tasktracker-deny-list</value></property>动态刷新配置的命令为： hadoop mradmin -refreshNodes 立刻生效，可以在webui中看到，nodes节点数量的变化，以及Excluded Nodes节点的变化。具体的步骤参考上面的删除datanode的步骤注：按照上面的操作后，如果你想要重新启用该节点为tasktracker，从mapred.hosts.exclude中删除该节点，refreshNodes，然后，到该节点上，重启启动该tasktracker： /usr/local/hadoop/bin/hadoop-daemon.sh stop tasktracker/usr/local/hadoop/bin/hadoop-daemon.sh start tasktracker注:正确的删除tasktracker的方法应该是按照上面的方法，使用exclude文件，而不应该直接去tasktracker上去sotp tasktracker，这样会造成job失败，而且stop以后，webui上仍然显示该tasktracker节点。除非重新启动jobtracker。我遇到的一个问题：在exclude文件中，我使用了IP，发现tasktracker仍然参与计算。在webui中发现，Excluded Nodes中存在该IP，Nodes中仍然存在该tasktracker的hostname。解决的办法就是，在exclude中使用hostname而不使用IP。判断是否真正生效：如果exclued文件中正确的填写了要失效的node，则总得nodes数量应该减小。 4、添加tasktracker 如果存在mapred.hosts文件，且不为空，则添加新的tasktracker到该文件中，refreshNodes。到新节点上，启动即可 /usr/local/hadoop/bin/hadoop-daemon.sh start tasktracker如果不存在mapred.hosts文件，或文件为空，直接启动新节点即可。 6、添加或删除datanode后，平衡磁盘利用率运行bin/start-balancer.sh，这个会很耗时间备注：如果不balance，那么cluster会把新的数据都存放在新的node上，这样会降低mr的工作效率； /usr/local/hadoop/bin/start-balancer.sh -threshold 0.17下架目标机器后，再次编辑mapred.hosts.exclude，把刚才下架的机器的ip或机器名移走threshold 是平衡阈值，默认是10%，值越低各节点越平衡，但消耗时间也更长。 balancer也可以在有mr job的cluster上运行，默认dfs.balance.bandwidthPerSec很低，为1M/s。在没有mr job时，可以提高该设置加快负载均衡时间。在namenode的hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property><name>dfs.balance.bandwidthPerSec</name><value>10485760</value><description>Specifies themaximum bandwidth that each datanode can utilize for the balancing purpose interm of the number of bytes per second.</description></property>

『柒』怎样使用命令行将hdfs上面的目录删除

命令：hadoopfs-rmr/home/mm/lily2(要求是你把hadoop的bin加到path中，并开启hadoop)rm-rf/home/mm/lily2（这是删除linux文件系统的文件夹）。删除目录rd/s/q"c:\hello"rem加引号可以防止因路径中有空格而出错rem上面的代码意为：删除c:\hello目录下所有的内容(包括"c:\hello")删除文件del/f/q/s"c:\hello\*.*"rem删除c;\hello文件夹下所有的文件，包括子文件夹的内容，（不包括子文件夹，也不包括c:\hello文件夹）rem文件夹=目录

『捌』如何删除hdfs文件

命令：hadoopfs-rmr/home/mm/lily2(要求是你把hadoop的bin加到PATH中，并开启hadoop)rm-rf/home/mm/lily2（这是删除linux文件系统的文件夹）

『玖』 hadoop上删除文件

如何恢复hadoop中被删除的文件hadoop的hdfs中被删除文件的恢复原理和回收站原理是一样的，就是在删除hdfs文件时，被删除的文件被移动到了hdfs的.trash文件夹中，恢复时只需将该文件夹中文件拿出即可。具体操作如下：1设置.trash文件夹如果需要恢复hdfs中文件，就需要设置.trash，hadoop的.trash默认是关闭的。具体设置如下：fs.trash.interval10080该配置项在core-site.xml中，fs.trash.interval代表删除的文件保留的时间，时间单位为分钟，默认为0代表不保存删除的文件。我们只需要设置该时间即可打开.trash。2设置后删除文件会显示删除的文件被移动到了hdfs://192.168.1.100:9000/user/hadoop/.trash/current中，举例如下：14/10/2016:48:24infofs.trashpolicydefault:namenodetrashconfiguration:deletioninterval=10080minutes,emptierinterval=0minutes.moved:'hdfs://10.207.0.217:9000/test_out/mr-20141017111556'totrashat:hdfs://192.168.1.100:9000/user/hadoop/.trash/current3恢复时只需要将.trash中文件移动到我们设置的目录即可，例如将.trash中test1文件移动到/test目录，bin/hadoopfs-mv/user/hadoop/.trash/current/test1/test4彻底删除hdfs文件彻底删除hdfs文件即将.trash中文件彻底删除，这样才能是否被删除文件所占用的hdfs空间，第2步中的删除方式hdfs不会释放空间，只是将需要删除的文件移动到了垃圾箱。.trash其实只是hdfs中的一个目录，只要删除该文件夹中的文件即可彻底删除该文件，原理相当于删除了回收站中的文件，该文件即被彻底删除。该项一般很少用，一般hdfs空间不够用才会用到。删除.trash中文件举例如下：bin/hadoopfs-rm-r/user/hadoop/.trash/current/test1

未经允许不得转载：山九号 » hdfs删除文件夹|如何删除hdfs文件

hdfs删除文件夹|如何删除hdfs文件

『壹』如何删除Hadoop

『贰』如何恢复hadoop中被删除的文件

『叁』 Hadoop程序中怎样用代码删除hafs中的文件和目录

『肆』如何删除每次运行hadoop命令的时输出目录

『伍』怎么删除home文件夹下的hadoop文件夹

『陆』如何在spark中删除hdfs的某个文件夹

『柒』怎样使用命令行将hdfs上面的目录删除

『捌』如何删除hdfs文件

『玖』 hadoop上删除文件

作者：大山

相关推荐

展示

最新文章

『壹』 如何删除Hadoop

『贰』 如何恢复hadoop中被删除的文件

『叁』 Hadoop程序中怎样用代码删除hafs中的文件和目录

『肆』 如何删除每次运行hadoop命令的时输出目录

『伍』 怎么删除home文件夹下的hadoop文件夹

『陆』 如何在spark中删除hdfs的某个文件夹

『柒』 怎样使用命令行将hdfs上面的目录删除

『捌』 如何删除hdfs文件

『玖』 hadoop上删除文件

作者：大山

相关推荐

展示

最新文章

『壹』如何删除Hadoop

『贰』如何恢复hadoop中被删除的文件

『肆』如何删除每次运行hadoop命令的时输出目录

『伍』怎么删除home文件夹下的hadoop文件夹

『陆』如何在spark中删除hdfs的某个文件夹

『柒』怎样使用命令行将hdfs上面的目录删除

『捌』如何删除hdfs文件