Linux系统诊断小技巧:启停问题之如何修复initrd损坏 | 您所在的位置:网站首页 › linux文件损坏原因 › Linux系统诊断小技巧:启停问题之如何修复initrd损坏 |
Linux系统诊断小技巧(14):启停问题之如何修复initrd损坏
简介: initrd丢失、损坏或者没有正常工作,是导致系统启动失败比较常见的原因。 如何解决这类问题呢?重新做initrd即可。那么,具体怎么操作呢?我们讨论下。这里我们主要是围绕阿里云的实例问题展开。 题外话我们先讲什么是initrd和需要的工具。 initrd的二意性initrd在Linux内核社区有两种意义。一是内核的一种启动机制。二是指实现这种机制的一种方法。作为方法的initrd,已经逐步被initramfs取代。 三大利器关于工具的重要性我们就不絮叨了。解决启停问题,一定要有三大利器的辅助:快照、VNC和录屏工具。 关于这些工具,请参考Linux系统诊断小技巧(13):启停问题之如何修复grub损坏对应小节。 bind挂载修复启停时经常需要做chroot操作,即我们要在一个新的根文件系统内操作。但是,只执行chroot是不够的。我们还需要挂载/dev、/proc和/sys目录。这样才能使用在chroot后继续使用系统数据。 关于bind挂载,同样请参考Linux系统诊断小技巧(13):启停问题之如何修复grub损坏对应小节。 回到话题initrd丢失、损坏或者没有正常工作,是导致系统启动失败比较常见的原因。 如何解决这类问题呢?重新做initrd即可。那么,具体怎么操作呢?我们讨论下。这里我们主要是围绕阿里云的实例问题展开。 现场复现initrd丢失相对容易模拟。重启、及时VNC登录,在grub提供可用内核清单界面,按字母e就能修改启动项配置。我们修改initrd文件名称即可。 修改文件名称 按照终端提示,启动系统,得到结果如下(但是这个界面很快会被内核堆栈信息覆盖,灵活使用录屏工具是需要的) 我们可以分别测试缺少主板驱动、磁盘驱动、显卡驱动等多种情形。简单计,这里我们只测试initrd只包括主板驱动的情形。 创建这样的initramfs,可以使用下面的命令: kernel_verion_str=$(uname -r) # chroot情形的话,需要手工设定 dracut -d virtio_pci /boot/initramfs-${kernel_version_str}-issues.img ${kernel_version_str}如果不是chroot环境,可以直接使用下面的命令 dracut -d virtio_pci /boot/initramfs-$(uname -r)-issues.img $(uname -r)命令执行示例如下: 验证下我们作出了initrd文件: 复现现场,现在: 常见的Linux系统都有救援模式,而且(大多)都是有多个内核可用。所以,一个内核的initrd出现问题,并不妨碍我们启动系统,拿到shell。但是,的确存在需要在其他系统上重新做initrd的情形。比如,我们运气不好,碰到的实例,其上的系统只有一个内核。这样现有系统是启动不起来了。系统启动不起来,则拿不到shell,拿不到shell,则读写不了系统盘。 所以,在运气不好的情况下,我们的问题就变成了两个: 通过什么方式来处理系统盘。怎么重新生成initrd。解决第一个问题的方法比较多,这里我们提供一个使用快照的方式。 如何使用快照?请参考Linux系统诊断小技巧(13):启停问题之如何修复grub损坏有关章节。 重新制作initrd的其他准备步骤在正常实例上重新制作initrd需要 # 1. 把新创建磁盘作为数据盘挂载到正常实例上。这需要在控制台操作。 # 2. 挂载目标根文件系统。 mount /dev/vdb1 /mnt # 3. 把/dev、/proc和/sys挂载到新挂载文件系统。这样我们就能够使用内核导出的系统数据了。 for d in dev proc sys;do mount --bind /$d /mnt/$d 4. chroot到目标根文件系统,使之成为当前跟文件系统。 chroot /mnt有关上面步骤的执行示例,请参考Linux系统诊断小技巧(13):启停问题之如何修复grub损坏有关章节。 重新制作initrd各个主流发行版都提供了制作initrd文件的易用工具,我们不赘述。这里我们以CentOS 7系统为例。重要的是要把需要启动系统所需的驱动不要忘记了。 对于阿里云当前的实例,主要是主板驱动(virtio_pci)和系统盘驱动(virtio_blk): # 1. 如果要制作initrd文件的版本号不同于当前运行的内核(比如chroot条件下), # 则需要手工设定内核版本号;否则,直接使用uname -r的结果即可 kernel_verion_str=... # 2. 备份老的文件 cp -p /boot/initramfs-${kernel_version_str}.img /boot/initramfs-${kernel_version_str}.img.origin # 3. 验证备份完毕 ls /boot/initramfs-${kernel_version_str}.img* # 4. 删除老的initrd文件 rm -f /boot/initramfs-${kernel_version_str}.img # 5. 重新生成initrd dracut --add-drivers "virio_pci virtio_blk" /boot/initramfs-${kernel_version_str}.img ${kernel_version_str}执行示例如下 这样我们就重新制作了initrd文件。 |
CopyRight 2018-2019 实验室设备网 版权所有 |