NodeManager出现DBException导致无法启动
NodeManager出现DBException导致无法启动
现象描述
NodeManager无法启动。NodeManager日志中显示如下错误信息。
org.fusesource.leveldbjni.internal.NativeDB$DBException: Corruption: 1 missing files;
可能原因
当“yarn.nodemanager.recovery.enabled”=“true”时,并且由于磁盘空间不足或文件句柄用尽,使“levelDB”作为NodeManager恢复被损坏时,会发生此异常情况。
处理步骤
- 删除在“yarn-site.xml”中“{yarn.nodemanager.recovery.dir}/yarn-nm-state”所指定的文件夹。
其产生结果如下:
- 对于已经在这个节点上完成的应用程序,其日志聚合可能会受影响。您需要手动删除已完成应用残留的文件或文件夹。进入{yarn.nodemanager.log-dirs}参数指定的路径,删除应用ID对应的文件夹。
- 在此节点上已本地化的临时文件和container临时文件不会被清理。您需要手动删除已完成应用残留的文件和文件夹。进入{yarn.nodemanager.local-dirs}参数指定的路径,删除应用ID对应的文件夹。
- 由于Container-tokens在NodeManager停用之后没有刷新,当前container可能会失败。
- 启动NodeManager。