21.3.RAID1——镜像

RAID1,或称 镜像,是将相同的数据写入一个以上的磁盘设备的技术。镜像通常被用来防止因磁盘故障而导致的数据丢失。镜像中的每个磁盘都包含一个相同的数据副本。当一个单独的磁盘发生故障时,镜像继续工作,提供来自仍在运行的磁盘的数据。计算机继续运行,管理员有时间在不影响用户的情况下更换故障磁盘。

这些例子中说明了两种常见的情况。第一个例子是用两个新的磁盘创建一个镜像,用它来替代现有的单个磁盘。第二个例子在一个新的磁盘上创建一个镜像,把旧的磁盘的数据复制到它上面,然后把旧的磁盘插入镜像中。虽然这个过程稍微复杂一些,但它只需要一个新的磁盘。

传统上,镜像中的两个磁盘在型号和容量上是相同的,但是 gmirror(8) 并不要求这样。用不同的磁盘创建的镜像,其容量等于镜像中最小的磁盘的容量。较大磁盘上的额外空间将不被使用。后来插入镜像的硬盘必须至少有与镜像中最小的硬盘一样的容量。

警告

这里显示的镜像步骤是非破坏性的,但与任何主要的磁盘操作一样,先做一个完整的备份。

警告

虽然 dump(8) 在这些程序中被用来复制文件系统,但它对有软更新日志的文件系统不起作用。参见 tunefs(8) 以获得关于检测和禁用软更新日志的信息。

21.3.1.元数据问题

许多磁盘系统在每个磁盘的末端存储元数据。在重新使用磁盘做镜像之前,应该擦除旧的元数据。大多数问题是由两种特殊类型的遗留元数据引起的:GPT 分区表和之前镜像的旧元数据。

可以用 gpart(8) 来擦除 GPT 元数据。这个例子删除了 ada8 磁盘上的 GPT 主分区表和 GPT 备份分区表。

# gpart destroy -F ada8

使用 gmirror(8) 可以将一个磁盘从活动镜像中移除,并在一个步骤中擦除元数据。这里例子中的磁盘 ada8 被从活动镜像 gm4 中移除:

# gmirror remove gm4 ada8

如果镜像没有运行,但是旧的镜像元数据仍然在磁盘上,使用 gmirror clear 来移除它:

# gmirror clear ada8

gmirror(8) 在磁盘的末端存储一个元数据块。由于 GPT 分区方案也在磁盘的末端存储元数据,所以不推荐用 gmirror(8) 来镜像整个 GPT 磁盘。这里使用 MBR 分区,因为它只在磁盘的开始部分存储一个分区表,不会与镜像元数据冲突。

21.3.2.用两个新磁盘创建一个镜像

在这个例子中,FreeBSD 已经被安装在一个单一的磁盘上,即 ada0。两个新的磁盘,ada1ada2 已经被连接到系统中。在这两个磁盘上将创建一个新的镜像,用来替换旧的单个磁盘。

geom_mirror.ko 内核模块必须被内置到内核中,或者在启动或运行时加载。现在手动加载内核模块:

# gmirror load

用两个新的磁盘创建镜像:

# gmirror label -v gm0 /dev/ada1 /dev/ada2

gm0 是一个用户选择的设备名称,分配给新的镜像。镜像启动后,这个设备名出现在 /dev/mirror/ 中。

现在可以用 gpart(8) 在镜像上创建 MBR 和 bsdlabel 分区表。这个例子使用了传统的文件系统布局,有 / 、 swap 、 /var/tmp/usr 分区。单一的 / 和交换分区也是可以的。

镜像上的分区不一定要和现有磁盘上的分区一样大,但它们必须大到足以容纳 ada0 上已有的所有数据。

# gpart create -s MBR mirror/gm0
# gpart add -t freebsd -a 4k mirror/gm0
# gpart show mirror/gm0
=>       63  156301423  mirror/gm0  MBR  (74G)
         63         63                    - free -  (31k)
        126  156301299                 1  freebsd  (74G)
  156301425         61                    - free -  (30k)
# gpart create -s BSD mirror/gm0s1
# gpart add -t freebsd-ufs  -a 4k -s 2g mirror/gm0s1
# gpart add -t freebsd-swap -a 4k -s 4g mirror/gm0s1
# gpart add -t freebsd-ufs  -a 4k -s 2g mirror/gm0s1
# gpart add -t freebsd-ufs  -a 4k -s 1g mirror/gm0s1
# gpart add -t freebsd-ufs  -a 4k mirror/gm0s1
# gpart show mirror/gm0s1
=>        0  156301299  mirror/gm0s1  BSD  (74G)
          0          2                      - free -  (1.0k)
          2    4194304                   1  freebsd-ufs  (2.0G)
    4194306    8388608                   2  freebsd-swap (4.0G)
   12582914    4194304                   4  freebsd-ufs  (2.0G)
   16777218    2097152                   5  freebsd-ufs  (1.0G)
   18874370  137426928                   6  freebsd-ufs  (65G)
  156301298          1                      - free -  (512B)

通过在 MBR 和 bsdlabel 中安装 bootcode 并设置活动 slice,使镜像可启动:

# gpart bootcode -b /boot/mbr mirror/gm0
# gpart set -a active -i 1 mirror/gm0
# gpart bootcode -b /boot/boot mirror/gm0s1

格式化新镜像上的文件系统,启用软更新。

# newfs -U /dev/mirror/gm0s1a
# newfs -U /dev/mirror/gm0s1d
# newfs -U /dev/mirror/gm0s1e
# newfs -U /dev/mirror/gm0s1f

现在可以用 dump(8)restore(8) 将原始 ada0 磁盘上的文件系统复制到镜像上。

# mount /dev/mirror/gm0s1a /mnt
# dump -C16 -b64 -0aL -f - / | (cd /mnt && restore -rf -)
# mount /dev/mirror/gm0s1d /mnt/var
# mount /dev/mirror/gm0s1e /mnt/tmp
# mount /dev/mirror/gm0s1f /mnt/usr
# dump -C16 -b64 -0aL -f - /var | (cd /mnt/var && restore -rf -)
# dump -C16 -b64 -0aL -f - /tmp | (cd /mnt/tmp && restore -rf -)
# dump -C16 -b64 -0aL -f - /usr | (cd /mnt/usr && restore -rf -)

编辑 /mnt/etc/fstab 以指向新的镜像文件系统:

# Device        Mountpoint  FStype  Options Dump    Pass#
/dev/mirror/gm0s1a  /       ufs rw  1   1
/dev/mirror/gm0s1b  none        swap    sw  0   0
/dev/mirror/gm0s1d  /var        ufs rw  2   2
/dev/mirror/gm0s1e  /tmp        ufs rw  2   2
/dev/mirror/gm0s1f  /usr        ufs rw  2   2

如果 geom_mirror.ko 内核模块没有被内置到内核中,编辑 /mnt/boot/loader.conf 以在启动时加载该模块:

geom_mirror_load="YES"

重新启动系统以测试新的镜像,并验证所有数据是否已经复制。BIOS 会把镜像看作是两个独立的硬盘,而非一个镜像。由于这两个硬盘是相同的,所以选择哪一个来启动并不重要。

如果启动有问题,请参见故障排除。关掉电源并断开原始 ada0 磁盘的连接,可以将其作为离线备份保存。

在使用中,镜像的行为就像原来的单盘一样。

21.3.3.用现有的磁盘创建一个镜像

在这个例子中,FreeBSD 已经被安装在一个单一的磁盘上,即 ada0。一个新的磁盘,ada1,已经被连接到系统中。在新的磁盘上将创建一个单盘镜像,将现有的系统复制到上面,然后将旧的磁盘插入镜像中。这个稍微复杂的过程是有必要的,因为 gmirror 需要在每个磁盘的末尾放一个 512 byte 的元数据块,而现有的 ada0 通常已经分配了所有的空间。

加载 geom_mirror.ko 内核模块:

# gmirror load

diskinfo 检查原始磁盘的镜像大小:

# diskinfo -v ada0 | head -n3
/dev/ada0
        512             # sectorsize
        1000204821504   # mediasize in bytes (931G)

在新磁盘上创建一个镜像。为了确保镜像的容量不比原来的 ada0 磁盘大,gnop(8) 被用来创建一个大小完全相同的假磁盘。这个磁盘不存储任何数据,只是用来限制镜像的大小。当 gmirror(8) 创建镜像时,它将把容量限制在 gzero.nop 的大小,即使新的 ada1 磁盘有更多的空间。注意,第二行中的 1000204821504 等于上面 diskinfo 显示的 ada0 的镜像大小。

# geom zero load
# gnop create -s 1000204821504 gzero
# gmirror label -v gm0 gzero.nop ada1
# gmirror forget gm0

由于 gzero.nop 不存储任何数据,镜像不会将其视为连接。镜像被告知要“忘记”未连接的组件,删除对 gzero.nop 的引用。结果是一个镜像设备只包含一个磁盘,ada1

创建 gm0 后,查看 ada0 的分区表。这个输出是来自一个 1TB 的磁盘。如果在磁盘的末端有一些未分配的空间,可以直接从 ada0 复制内容到新的镜像。

但是,如果输出显示磁盘上的所有空间都被分配了,就像下面的列表一样,那么磁盘末端的 512 byte 的镜像元数据就没有可用空间了:

# gpart show ada0
=>        63  1953525105        ada0  MBR  (931G)
          63  1953525105           1  freebsd  [active]  (931G)

在这种情况下,必须编辑分区表以减少镜像 /gm0 上一个扇区的容量。这个过程将在后面进行解释。

在这两种情况下,应首先使用 gpart backupgpart restore 来复制主磁盘上的分区表:

# gpart backup ada0 > table.ada0
# gpart backup ada0s1 > table.ada0s1

这些命令创建了两个文件,table.ada0table.ada0s1。这个例子来自一个 1TB 的硬盘:

# cat table.ada0
MBR 4
1 freebsd         63 1953525105   [active]
# cat table.ada0s1
BSD 8
1  freebsd-ufs          0    4194304
2 freebsd-swap    4194304   33554432
4  freebsd-ufs   37748736   50331648
5  freebsd-ufs   88080384   41943040
6  freebsd-ufs  130023424  838860800
7  freebsd-ufs  968884224  984640881

如果在磁盘的末端没有显示出自由空间,那么 slice 和最后一个分区的大小都必须减少一个扇区。编辑这两个文件,将 slice 和最后一个分区的大小都减少一个。这些是每个列表中的最后数字:

# cat table.ada0
MBR 4
1 freebsd         63 1953525104   [active]
# cat table.ada0s1
BSD 8
1  freebsd-ufs          0    4194304
2 freebsd-swap    4194304   33554432
4  freebsd-ufs   37748736   50331648
5  freebsd-ufs   88080384   41943040
6  freebsd-ufs  130023424  838860800
7  freebsd-ufs  968884224  984640880

如果在磁盘的末端至少有一个扇区没有被分配,这两个文件可以不加修改地使用。

现在将分区表恢复到 mirror/gm0

# gpart restore mirror/gm0 < table.ada0
# gpart restore mirror/gm0s1 < table.ada0s1

gpart show 检查分区表。这个例子中,gm0s1a 代表 /gm0s1d 代表 /vargm0s1e 代表 /usrgm0s1f 代表 /data1,而 gm0s1g 代表 /data2

# gpart show mirror/gm0
=>        63  1953525104  mirror/gm0  MBR  (931G)
          63  1953525042           1  freebsd  [active]  (931G)
  1953525105          62              - free -  (31k)

# gpart show mirror/gm0s1
=>         0  1953525042  mirror/gm0s1  BSD  (931G)
           0     2097152             1  freebsd-ufs  (1.0G)
     2097152    16777216             2  freebsd-swap  (8.0G)
    18874368    41943040             4  freebsd-ufs  (20G)
    60817408    20971520             5  freebsd-ufs  (10G)
    81788928   629145600             6  freebsd-ufs  (300G)
   710934528  1242590514             7  freebsd-ufs  (592G)
  1953525042          63                - free -  (31k)

slice 和最后一个分区都必须在磁盘的末端有至少一个空闲块。

在这些新分区上创建文件系统。分区的数量将有所不同,以配合原始磁盘,即 ada0

# newfs -U /dev/mirror/gm0s1a
# newfs -U /dev/mirror/gm0s1d
# newfs -U /dev/mirror/gm0s1e
# newfs -U /dev/mirror/gm0s1f
# newfs -U /dev/mirror/gm0s1g

通过在 MBR 和 bsdlabel 中安装 bootcode 并设置活动 slice,使镜像可启动:

# gpart bootcode -b /boot/mbr mirror/gm0
# gpart set -a active -i 1 mirror/gm0
# gpart bootcode -b /boot/boot mirror/gm0s1

调整 /etc/fstab 以使用镜像上的新分区。先把这个文件复制到 /etc/fstab.orig,以此来备份:

# cp /etc/fstab /etc/fstab.orig

编辑 /etc/fstab,将 /dev/ada0 替换为 mirror/gm0

# Device        Mountpoint  FStype  Options Dump    Pass#
/dev/mirror/gm0s1a  /       ufs rw  1   1
/dev/mirror/gm0s1b  none        swap    sw  0   0
/dev/mirror/gm0s1d  /var        ufs rw  2   2
/dev/mirror/gm0s1e  /usr        ufs rw  2   2
/dev/mirror/gm0s1f  /data1      ufs rw  2   2
/dev/mirror/gm0s1g  /data2      ufs rw  2   2

如果 geom_mirror.ko 内核模块没有被内置到内核中,编辑 /boot/loader.conf 在启动时加载它:

geom_mirror_load="YES"

现在可以用 dump(8)restore(8) 将原始磁盘的文件系统复制到镜像上。用 dump -L 转储的每个文件系统都会先创建一个快照,这可能需要一些时间:

# mount /dev/mirror/gm0s1a /mnt
# dump -C16 -b64 -0aL -f - /    | (cd /mnt && restore -rf -)
# mount /dev/mirror/gm0s1d /mnt/var
# mount /dev/mirror/gm0s1e /mnt/usr
# mount /dev/mirror/gm0s1f /mnt/data1
# mount /dev/mirror/gm0s1g /mnt/data2
# dump -C16 -b64 -0aL -f - /usr | (cd /mnt/usr && restore -rf -)
# dump -C16 -b64 -0aL -f - /var | (cd /mnt/var && restore -rf -)
# dump -C16 -b64 -0aL -f - /data1 | (cd /mnt/data1 && restore -rf -)
# dump -C16 -b64 -0aL -f - /data2 | (cd /mnt/data2 && restore -rf -)

重新启动系统,从 ada1 启动。如果一切正常,系统将从 mirror/gm0 启动,现在 mirror/gm0 包含的数据与 ada0 之前的一样。如果启动有问题,请看故障排除

在这一点上,镜像仍然只包括单一的 ada1 磁盘。

mirror/gm0 成功启动后,最后一步是将 ada0 插入镜像中。

重要

ada0 被插入镜像时,它以前的内容会被镜像的数据覆盖。在将 ada0 加入镜像之前,请确定 mirror/gm0 的内容与 ada0 相同。如果之前通过 dump(8)restore(8) 复制的内容与 ada0 上的内容不一致,请重新修改 /etc/fstab,将文件系统挂载到 ada0 上,重新启动,然后重新开始整个过程。

# gmirror insert gm0 ada0
GEOM_MIRROR: Device gm0: rebuilding provider ada0

两个磁盘之间的同步将立即开始。使用 gmirror status 来查看进度。

# gmirror status
      Name    Status  Components
mirror/gm0  DEGRADED  ada1 (ACTIVE)
                      ada0 (SYNCHRONIZING, 64%)

一段时间后,同步将结束。

GEOM_MIRROR: Device gm0: rebuilding provider ada0 finished.
# gmirror status
      Name    Status  Components
mirror/gm0  COMPLETE  ada1 (ACTIVE)
                      ada0 (ACTIVE)

mirror/gm0 现在由两个磁盘 ada0ada1 组成,内容会自动相互同步。在使用中,mirror/gm0 的行为就像原来的单硬盘一样。

21.3.4.故障排除

如果系统不启动,可能需要改变 BIOS 设置,以便从新的镜像磁盘中的一个启动。任何一个镜像磁盘都可以用来启动,因为它们包含相同的数据。

如果启动停止时出现这个信息,说明镜像设备出了问题。

Mounting from ufs:/dev/mirror/gm0s1a failed with error 19.

Loader variables:
  vfs.root.mountfrom=ufs:/dev/mirror/gm0s1a
  vfs.root.mountfrom.options=rw

Manual root filesystem specification:
  <fstype>:<device> [options]
      Mount <device> using filesystem <fstype>
      and with the specified (optional) option list.

    eg. ufs:/dev/da0s1a
        zfs:tank
        cd9660:/dev/acd0 ro
          (which is equivalent to: mount -t cd9660 -o ro /dev/acd0 /)

  ?               List valid disk boot devices
  .               Yield 1 second (for background tasks)
  <empty line>    Abort manual input

mountroot>

忘记在 /boot/loader.conf 中加载 geom_mirror.ko 模块会导致这个问题。要解决这个问题,从 FreeBSD 安装设备启动,在第一个提示符下选择 Shell。然后加载镜像模块并安装镜像设备:

# gmirror load
# mount /dev/mirror/gm0s1a /mnt

编辑 /mnt/boot/loader.conf,添加这一行来加载镜像模块:

geom_mirror_load="YES"

保存该文件并重新启动。

其他导致 error 19 的问题需要更多的努力来解决。尽管系统应该从 ada0 启动,但如果 /etc/fstab 不正确,会出现另一个选择 shell 的提示。在引导加载器提示下输入 ufs:/dev/ada0s1a,然后按回车键。撤销在 /etc/fstab 中的编辑,然后从原始磁盘(ada0)而非镜像中加载文件系统。重新启动系统并再次尝试该过程。

Enter full pathname of shell or RETURN for /bin/sh:
# cp /etc/fstab.orig /etc/fstab
# reboot

21.3.5.从磁盘故障中恢复

磁盘镜像的好处是,一个单独的磁盘可以发生故障而不会导致镜像丢失任何数据。在上面的例子中,如果 ada0 发生故障,镜像将继续工作,从剩余的工作的磁盘,ada1 提供数据。

要更换故障的硬盘,请关闭系统,用一个容量相同或更大的新硬盘物理替换故障的硬盘。制造商在以 GB 为单位对硬盘进行评级时,使用了一些任意的数值,真正确定的唯一方法是比较 diskinfo -v 所显示的扇区总数。容量大于镜像的磁盘可以工作,尽管新磁盘上的额外空间将不会被使用。

在计算机重新上电后,镜像将以“降级”模式运行,即只有一个磁盘。镜像被告知要忘记当前没有连接的磁盘:

# gmirror forget gm0

任何旧的元数据都应该按照元数据问题中的说明从替换磁盘中清除。然后将替换磁盘(本例中为 ada4)插入镜像中:

# gmirror insert gm0 /dev/ada4

当新的磁盘被插入镜像时,重新同步开始。这个将镜像数据复制到新磁盘的过程可能需要一段时间。在复制过程中,镜像的性能会大大降低,所以插入新的磁盘最好在计算机上的需求较低时进行。

可以用 gmirror status 监控进度,它显示正在同步的磁盘和完成的百分比。在重新同步的过程中,状态将是 DEGRADED,当这个过程结束时将变为 COMPLETE