弹性云服务器 ECS-怎样配置Linux分析工具:atop和kdump:配置kdump操作步骤

时间:2025-05-09 18:50:59

配置kdump操作步骤

  1. 查看是否已经安装kexec-tools。

    rpm -q kexec-tools

    如果没有安装,则执行下面命令安装。

    yum install -y kexec-tools

  2. 开启kdump默认启动。

    systemctl enable kdump

  3. 设置crashkernel参数,设置这个参数的目的是预留内存给capture kernel。

    首先查看参数是否已经设置。

    grep crashkernel /proc/cmdline

    如果有显示,则表示已经设置,如果没有显示,则需要重新设置。

    设置crashkernel,编辑/etc/default/grub文件。
    GRUB_TIMEOUT=5
    GRUB_DEFAULT=saved
    GRUB_DISABLE_SUBMENU=true
    GRUB_TERMINAL_OUTPUT="console"
    GRUB_CM DLI NE_LINUX="crashkernel=auto rd.lvm.lv=rhel00/root rd.lvm.lv=rhel00/swap
    rhgb quiet"
    GRUB_DISABLE_RECOVERY="true"

    找到GRUB_CMDLINE_LINUX参数,添加crashkernel=auto,其他内容不变。

  4. 执行grub命令,使以上配置生效。

    grub2-mkconfig -o /boot/grub2/grub.cfg

  5. 打开/etc/kdump.conf文件中找到“path”参数,添加以下内容。
    path  /var/crash

    默认是保存在/var/crash目录下,如果要保存到其他目录,则改成对应的目录,

    例如保存在/home/kdump下,则改成:
    path  /home/kdump

    要确保指定的路径有足够的空间保存vmcore,建议剩余空间不小于 RAM 大小;也可以保存在SAN,nfs等共享设备上。

  6. 设置转存vmcore级别。

    修改/etc/kdump.conf文件,添加如下参数,如果存在则无需添加。

    core_collector makedumpfile -d 31 -c

    -c表示压缩vmcore文件,

    -d表示过滤掉部分无效的内存数据,可以根据需要调整,一般31即可,31是由如下的值与计算而成。

    zero pages   = 1
    cache pages   = 2
    cache private = 4
    user  pages   = 8
    free  pages   = 16
  7. 执行如下命令重启系统,使以上配置生效。

    reboot

support.huaweicloud.com/trouble-ecs/ecs_trouble_0328.html