博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hadoop常见错误2
阅读量:6689 次
发布时间:2019-06-25

本文共 813 字,大约阅读时间需要 2 分钟。

问题1:在程序的日志中看到,在reduce阶段出现了异常:Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out ,程序里需要打开文件,系统默认为1024,也可以通过ulimit -a查看

编辑文件/etc/security/limits.conf 在文件后面添加:

# End of file * soft       nofile 102400 * hard       nofile 409600

遇到这种错误网上也有不同的可能解决方法和解释,你们可以自己找找。

问题2: yarn日志页面出现异常:

Java HotSpot(TM) 64-Bit Server VM warning: Insufficient space for shared memory file: /tmp/hsperfdata_hdp/6676 Try using the -Djava.io.tmpdir= option to select an alternate temp location

原因是根目录空间不足,解决问题的办法之一是清理根目录下不必要的文件,解决办法二就是,上面也就有提示了,不多说了。

/tmp/hsperfdata_username 目录的作用是什么呢?

jvm运行时在linux下默认在/tmp下生成上面的目录,目录下存放pid文件,和一些jvm进程信息,jmap、jstack等工具会读取该目录下的pid文件获取链接信息

问题3: 当任务不能跑满集群的时,为什么集群的节点会出现几个节点跑满容器,而其他节点则非常空闲?

原因是集群调度器默认处于批处理模式下,一个心跳会尽可能的分配任务,心跳先到达则会优先领取任务,我们可以通过参数yarn.scheduler.fair.max.assign参数设置为1,就可以大致的均衡任务到不同的节点

转载地址:http://fcuoo.baihongyu.com/

你可能感兴趣的文章
java----牛客练习
查看>>
用php模拟做服务端侦听端口
查看>>
C#基础
查看>>
.Net反射机制分析和使用
查看>>
[摘录]第二部分 战略决策(2)
查看>>
线程之同步函数
查看>>
禁用DRM
查看>>
Algs4-1.3链表实现科泛型可迭代Bag
查看>>
事件委托(事件代理)
查看>>
Java判断对象类型是否为数组
查看>>
前端心得01
查看>>
python函数调用的四种方式 --基础重点
查看>>
Git015--标签管理
查看>>
WF Workflow 状态机工作流 开发
查看>>
hdu Hat's Tea
查看>>
linux每日命令(13):more命令
查看>>
第八章 指针实验
查看>>
谁是世界上最丑的人
查看>>
孙氏内家拳中的桩功
查看>>
批量删除Maven 仓库未下载成功.lastupdate 的文件
查看>>