北京SEO

Hadoop更换du命令降低datanode磁盘IO

2019/10/10/17:46:07  阅读:1702  来源:谷歌SEO算法  标签: 微信公众号

Hadoop是一个比较好用的分布式系统基础架构了,下面我们来到各位介绍Hadoop更换du命令降低datanode磁盘IO例子,希望对各位带来帮助.

背景介绍:近期,不少datanode节点的磁盘IO比较高,主要原因还是由于job数量的增多,以及规模的增大.

但任何可以降低磁盘IO消耗的手段,我们都可以尝试一下,比如,我们经常可以看到hdfs用户在执行"du -sk"命令:

  1. [root@idc1-server2~]#ps-ef|grep"du-sk"
  2. hdfs1711910336100:57?00:00:04du-sk/data1/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062
  3. hdfs1714210336100:57?00:00:03du-sk/data5/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062
  4. hdfs1715110336100:57?00:00:05du-sk/data6/dfs/dn/current/BP-1281416642-10.100.1.2-1407274717062
  5. ...//phpfensi.com

随着datanode上的数据不断增加,这样频繁的du操作,会耗时比较长,在CPU和磁盘IO很闲的时候,每次也都会耗时5秒左右,而在服务器负载比较高的时候,这样的操作就会耗时很长时间.

于是,我们便考虑通过将原有的du命令替换,并基于df命令来编写一个新的du命令来取而代之,代码如下:

  1. [root@idc1-server2~]#mv/usr/bin/du/usr/bin/du.orig
  2. [root@idc1-server2~]#vim/usr/bin/du
  3. #!/bin/sh
  4. mydf=$(df-Pk$2|grep-vE'^Filesystem|tmpfs|cdrom'|awk'{print$3}')
  5. echo-e"$mydft$2"
  6. [root@idc1-server2~]#chmod+x/usr/bin/du

不过这样的话,统计出来的结果不就不准确了吗?

但具体情况具体应对,一般来说,Hadoop的datanode都会采用不同的磁盘并划分分区来存储数据,那么使用df统计出来的结果,误差应该是很小的.

广告内容

Hadoop更换du命令降低datanode磁盘IO Hadoop更换du命令降低datanode磁盘IO Hadoop更换du命令降低datanode磁盘IO

相关阅读

热门评论

昝辉Zac 昝辉Zac

Zac的SEO博客,坚持12年,优化成为生活。

总篇数171

精选文章

RMAN中catalog和nocatalog区别介绍 小技巧:为Linux下的文件分配多个权限 zimbra8.5.1安装第三方签名ssl证书的步骤 解决mysql不能远程连接数据库方法 windows服务器mysql增量备份批处理数据库 mysql中slow query log慢日志查询分析 JavaScript跨域问题总结 Linux下负载均衡软件LVS配置(VS/DR)教程 mysql中权限参数说明 MYSQL(错误1053)无法正常启动

SEO最新算法