NodeManager出现DBException导致无法启动

NodeManager出现DBException导致无法启动

现象描述

NodeManager无法启动。NodeManager日志中显示如下错误信息。

org.fusesource.leveldbjni.internal.NativeDB$DBException: Corruption: 1 missing files;

可能原因

当“yarn.nodemanager.recovery.enabled”=“true”时,并且由于磁盘空间不足或文件句柄用尽,使“levelDB”作为NodeManager恢复被损坏时,会发生此异常情况。

处理步骤

  1. 删除在“yarn-site.xml”中“{yarn.nodemanager.recovery.dir}/yarn-nm-state”所指定的文件夹。 其产生结果如下:
    • 对于已经在这个节点上完成的应用程序,其日志聚合可能会受影响。您需要手动删除已完成应用残留的文件或文件夹。进入{yarn.nodemanager.log-dirs}参数指定的路径,删除应用ID对应的文件夹。
    • 在此节点上已本地化的临时文件和container临时文件不会被清理。您需要手动删除已完成应用残留的文件和文件夹。进入{yarn.nodemanager.local-dirs}参数指定的路径,删除应用ID对应的文件夹。
    • 由于Container-tokens在NodeManager停用之后没有刷新,当前container可能会失败。
  2. 启动NodeManager。

关注公众号“大模型全栈程序员”回复“小程序”获取1000个小程序打包源码。更多免费资源在http://www.gitweixin.com/?p=2627

发表评论

邮箱地址不会被公开。 必填项已用*标注