1) 执行df -h命令
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/VolGroup-lv_root
30G 9.2G 19G 33% /
tmpfs 3.9G 0 3.9G 0% /dev/shm
/dev/sda1 477M 64M 389M 14% /boot
/dev/mapper/VolGroup-lv_data
130G 101G 23G 82% /xxx
/dev/mapper/VolGroup-lv_var
30G 582M 28G 3% /var
可以查看整个磁盘的挂在情况,通过这个命令可以发现 xxx的负载是 82%
2) 执行du -sch * | grep G 查看当前目录下文件大于一个G的文件 或者执行 ll -h 查看某个文件的大小
[root@10.125.31.52 gomeo2o]# du -sch * |grep G
83G data
11G logs
6.3G software
100G total
3) 这个时候就可以删除某些大于1G的文件4) 执行hadoop fs -ls / 查看hdfs集群中都有哪些文件
5) 执行hadoop fs -du -h / 查看hdfs中集群中文件的大小
6) 执行hadoop fs -rmr /tmp/* 比如我们这里删除tmp下的文件
7) 执行hadoop fs -rmr /user/hadoop/.Trash 清空垃圾站 否则 第六步删除的文件会存放在垃圾站中,还是占用磁盘空间
---备注:/user/hadoop中hadoop是超级用户
8) 等待大于30s(垃圾站清空需要一定时间) 再次执行 df 可以看到磁盘占用率下降
另外Zookeeper也是需要关注的一点:
正常运行过程中,ZK会不断把快照数据和事务日志输出到两个目录下,并且如果没有认为操作的话,ZK自己是不会清理这些文件的,需要管理员来清理。
清理的方式常用的有三种:
1)直接rm 日志文件和快照文件 (--这种方式比较常用,常用于运维人员写在脚本中)
2)执行zkClieanup.sh -n 3 只保留最新的三份日志文件和快照文件 (--这种方式比较常用,可以防止误删数据)
3)在zoo.cfg配置文件中配置 (--这种方式在对性能要求比较高的场景下,会出现问题)
版权声明:本文为u011317245原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。