在 Linux 上配置软件 RAID

一种比较常见的情况是,在 Azure 中的 Linux 虚拟机上使用软件 RAID 将多个附加的数据磁盘显示为单个 RAID 设备。 通常,与仅使用单个磁盘相比,使用此方法不但可改进性能,而且还可提高吞吐量。

附加数据磁盘

配置 RAID 设备需要两个或更多空数据磁盘。 创建 RAID 设备的主要原因是为了提高磁盘的 IO 性能。 根据 IO 需求,可以选择附加存储在标准存储且一个磁盘最多具有 500 IO/ps 的磁盘,或高级存储且一个磁盘最多具有 5000 IO/ps 的磁盘。 本文不详细介绍如何为 Linux 虚拟机预配和附加数据磁盘。 请参阅 Microsoft Azure 文章附加磁盘,详细了解如何在 Azure 上为 Linux 虚拟机附加空数据磁盘。

重要

请勿混合使用不同大小的磁盘,否则会导致 RAID 集的性能被限制为运行速度最慢磁盘的性能。

安装 mdadm 实用程序

  • Ubuntu

    sudo apt-get update
    sudo apt-get install mdadm
    
  • CentOS 和 Oracle Linux

    sudo yum install mdadm
    
  • SLES 和 openSUSE

    zypper install mdadm
    

创建磁盘分区

在此示例中,我们在 /dev/sdc 上创建单个磁盘分区。 该新磁盘分区将命名为 /dev/sdc1。

  1. 启动 fdisk ,以开始创建分区

    sudo fdisk /dev/sdc
    Device contains neither a valid DOS partition table, nor Sun, SGI or OSF disklabel
    Building a new DOS disklabel with disk identifier 0xa34cb70c.
    Changes will remain in memory only, until you decide to write them.
    After that, of course, the previous content won't be recoverable.
    
    WARNING: DOS-compatible mode is deprecated. It's strongly recommended to
                    switch off the mode (command 'c') and change display units to
                    sectors (command 'u').
    
  2. 在提示符处按 N 键,以创建新 分区:

    Command (m for help): n
    
  3. 接下来,按 P 键以创建主分区 :

    Command action
            e   extended
            p   primary partition (1-4)
    
  4. 按 1 键,以选择分区号 1:

    Partition number (1-4): 1
    
  5. 选择新分区的起始点,或者按 <enter> 接受默认值,将该分区放在驱动器可用空间的开头:

    First cylinder (1-1305, default 1):
    Using default value 1
    
  6. 选择分区大小,如键入“+10G”创建一个 10 GB 的分区。 或者,按 <enter> 创建跨整个驱动器的单个分区:

    Last cylinder, +cylinders or +size{K,M,G} (1-1305, default 1305): 
    Using default value 1305
    
  7. 接下来,将该分区的 ID 和类型从默认的 ID“83”(Linux) 更改为 ID“fd”(Linux raid auto):

    Command (m for help): t
    Selected partition 1
    Hex code (type L to list codes): fd
    
  8. 最后,将分区表写入驱动器并退出 fdisk:

    Command (m for help): w
    The partition table has been altered!
    

创建 RAID 阵列

  1. 以下示例将给位于三个不同数据磁盘(sdc1、sdd1、sde1)上的三个分区设置带区(RAID 级别 0)。 运行此命令后会创建一个名为 /dev/md127 的新 RAID 设备。 另请注意,如果这些数据磁盘以前属于另一失效的 RAID 阵列,则可能有必要将 --force 参数添加到 mdadm 命令:

    sudo mdadm --create /dev/md127 --level 0 --raid-devices 3 \
        /dev/sdc1 /dev/sdd1 /dev/sde1
    
  2. 在新 RAID 设备上创建文件系统

    CentOS、Oracle Linux、SLES 12、openSUSE 和 Ubuntu

    sudo mkfs -t ext4 /dev/md127
    

    SLES 11

    sudo mkfs -t ext3 /dev/md127
    

    SLES 11 - 启用 boot.md 并创建 mdadm.conf

    sudo -i chkconfig --add boot.md
    sudo echo 'DEVICE /dev/sd*[0-9]' >> /etc/mdadm.conf
    

    注意

    在 SUSE 系统中进行这些更改后,可能需要重新启动。 在 SLES 12 中, 需要执行此步骤。

将新文件系统添加到 /etc/fstab

重要

错误地编辑 /etc/fstab 文件可能会导致系统无法引导。 如果没有把握,请参考分发的文档来获取有关如何正确编辑该文件的信息。 另外,建议在编辑前备份 /etc/fstab 文件。

  1. 为新文件系统创建所需的安装点,例如:

    sudo mkdir /data
    
  2. 编辑 /etc/fstab 文件时,使用 UUID 引用文件系统,而非设备名称。 使用 blkid 实用程序确定新文件系统的 UUID:

    sudo /sbin/blkid
    ...........
    /dev/md127: UUID="aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee" TYPE="ext4"
    
  3. 在文本编辑器中打开 /etc/fstab,并为新文件系统添加条目,例如:

    UUID=aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee  /data  ext4  defaults  0  2
    

    或在 SLES 11 上:

    /dev/disk/by-uuid/aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee  /data  ext3  defaults  0  2
    

    然后,保存并关闭 /etc/fstab。

  4. 测试该 /etc/fstab 条目是否正确:

    sudo mount -a
    

    如果此命令导致错误消息,请检查 /etc/fstab 文件中的语法。

    接下来,运行 mount 命令以确保文件系统已装入:

    mount
    .................
    /dev/md127 on /data type ext4 (rw)
    
  5. (可选)防故障引导参数

    fstab 配置

    许多分发版包括 nobootwaitnofail 装载参数,这些参数可以添加到 /etc/fstab 文件中。 这些参数允许装入某特定文件系统时失败,并且允许 Linux 系统继续引导,即使它无法正确装入 RAID 文件系统也无妨。 有关这些参数的详细信息,请查阅分发文档。

    示例 (Ubuntu):

    UUID=aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee  /data  ext4  defaults,nobootwait  0  2
    

    Linux 引导参数

    除了以上参数,还可以使用内核参数“bootdegraded=true”启用系统引导功能,即使发现 RAID 已损坏或降级(例如,如果意外从虚拟机移除数据驱动器)。 默认情况下,这也可能会导致系统无法启动。

    请参阅发行版文档,了解如何正确编辑内核参数。 例如,在许多分发(CentOS、Oracle Linux、SLES 11)中,可以手动将这些参数添加到“/boot/grub/menu.lst”文件。 在 Ubuntu 中,可将此参数添加到“/etc/default/grub”的 GRUB_CMDLINE_LINUX_DEFAULT 变量。

TRIM/UNMAP 支持

某些 Linux 内核支持 TRIM/UNMAP 操作以放弃磁盘上未使用的块。 这些操作主要适用于标准存储,以通知 Azure 已删除的页不再有效可以丢弃。 如果创建了较大的文件,并将其删除,则放弃页可以节省成本。

注意

如果将阵列的区块大小设置为小于默认值 (512 KB),则 RAID 可能不会发出丢弃命令。 这是因为主机上的 unmap 粒度也是 512KB。 如果通过 mdadm 的 --chunk= 参数修改了阵列的区块大小,则内核可能会忽略 TRIM/unmap 请求。

在 Linux VM 中有两种方法可以启用 TRIM 支持。 与往常一样,有关建议的方法,请参阅分发:

  • /etc/fstab 中使用 discard 装载选项,例如:

    UUID=aaaaaaaa-bbbb-cccc-dddd-eeeeeeeeeeee  /data  ext4  defaults,discard  0  2
    
  • 在某些情况下,discard 选项可能会影响性能。 此处,还可以从命令行手动运行 fstrim 命令,或将其添加到 crontab 以定期运行:

    Ubuntu

    # sudo apt-get install util-linux
    # sudo fstrim /data
    

    RHEL/CentOS

    # sudo yum install util-linux
    # sudo fstrim /data