Documentation du Dr FRAPPE

Ce wiki regroupe les résultats de mes expériences en informatique accumulés au cours de mes recherches sur le net.

Dans la mesure du possible, j'ai cité mes sources ; il en manque certainement… :-)

RAID 1 logiciel : Simuler une panne de disque et rétablir le RAID

Pré-requis

Première étape

  1. Affichez les noms des partitions disponibles :

    ...@...:~$ sudo cat /proc/mdstat 
    Personalities : [raid1] 
    md0 : active raid1 sda1[0] sdb1[1]
          117153216 blocks super 1.2 [2/2] [UU]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

    → Nous avons une grappe RAID /dev/md0 (/dev/sda1 et /dev/sdb1)

Autres étapes

  1. Simulez la défaillance du disque sda en mettant en fail la partition sda1 :

    ...@...:~$ sudo mdadm --manage /dev/md0 --fail /dev/sda1
    mdadm: set /dev/sda1 faulty in /dev/md0

    Résultat :

    ...@...:~$ sudo cat /proc/mdstat
    Personalities : [raid1] 
    md0 : active raid1 sda1[0](F) sdb1[1]
          117153216 blocks super 1.2 [2/1] [_U]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

    → la partition sda1 est montrée comme « F » (Faulty). Pour plus de détails :

    ...@...:~$ sudo mdadm -D /dev/md0
    /dev/md0:
               Version : 1.2
         Creation Time : Thu Oct 15 09:17:35 2020
            Raid Level : raid1
            Array Size : 117153216 (111.73 GiB 119.96 GB)
         Used Dev Size : 117153216 (111.73 GiB 119.96 GB)
          Raid Devices : 2
         Total Devices : 2
           Persistence : Superblock is persistent
    
         Intent Bitmap : Internal
    
           Update Time : Mon Oct 19 09:38:09 2020
                 State : clean, degraded 
        Active Devices : 1
       Working Devices : 1
        Failed Devices : 1
         Spare Devices : 0
    
    Consistency Policy : bitmap
    
                  Name : framboise4:0  (local to host framboise4)
                  UUID : f88601ca:d0e78820:c242a066:82223b32
                Events : 1261
    
        Number   Major   Minor   RaidDevice State
           -       0        0        0      removed
           1       8       17        1      active sync   /dev/sdb1
    
           0       8        1        -      faulty   /dev/sda1

  2. Vérifiez vos e-mails, vous avez du recevoir un e-mail de ce type :
    Sujet : DegradedArray event on /dev/md0:framboise4
    De : mdadm monitoring <root>
    Date : 19/10/2020 à 09:50
    Pour : votre_adresse@mail.tld
    This is an automatically generated mail message from mdadm
    running on framboise4
    A DegradedArray event had been detected on md device /dev/md0.
    Faithfully yours, etc.
    P.S. The /proc/mdstat file currently contains the following:
    Personalities : [raid1]
    md0 : active raid1 sda1[0](F) sdb1[1]
    117153216 blocks super 1.2 [2/1] [_U]
    bitmap: 0/1 pages [0KB], 65536KB chunk
    unused devices: <none>

    Le RAID étant dégradé, nous allons voir comment le rétablir pour ne plus recevoir de mails.
    Pour cela, il faut retirer complètement /dev/sda1 du RAID et le rajouter.

  3. Retirez du RAID le disque marqué comme faulty :

    ...@...:~$ sudo mdadm --manage /dev/md0 --remove /dev/sda1
    mdadm: hot removed /dev/sda1 from /dev/md0

  4. Résultat :

    ...@...:~$ sudo mdadm -D /dev/md0
    /dev/md0:
               Version : 1.2
         Creation Time : Thu Oct 15 09:17:35 2020
            Raid Level : raid1
            Array Size : 117153216 (111.73 GiB 119.96 GB)
         Used Dev Size : 117153216 (111.73 GiB 119.96 GB)
          Raid Devices : 2
         Total Devices : 1
           Persistence : Superblock is persistent
    
         Intent Bitmap : Internal
    
           Update Time : Mon Oct 19 10:52:10 2020
                 State : clean, degraded 
        Active Devices : 1
       Working Devices : 1
        Failed Devices : 0
         Spare Devices : 0
    
    Consistency Policy : bitmap
    
                  Name : framboise4:0  (local to host framboise4)
                  UUID : f88601ca:d0e78820:c242a066:82223b32
                Events : 1262
    
        Number   Major   Minor   RaidDevice State
           -       0        0        0      removed
           1       8       17        1      active sync   /dev/sdb1

    Le RAID est toujours dégradé mais actif sur un seul disque.

  5. c'est ici qu'on changerait le disque dans la réalité
    • Arrêtez la machine
    • Changez le disque physique
    • Rallumez la machine et partitionnez le nouveau disque à l'identique (attention à ne pas vous tromper de partitions ! on copie le disque sain vers l'autre) :

      ...@...:~$ sudo sfdisk -d /dev/sdb | sudo sfdisk /dev/sda

  6. Rajoutez la (nouvelle) partition de sda1 dans le RAID :

    ...@...:~$ sudo mdadm --manage /dev/md0 --add /dev/sda1
    mdadm: re-added /dev/sda1

  7. Le RAID se resynchronise :

    ...@...:~$ cat /proc/mdstat
    Personalities : [raid1] 
    md0 : active raid1 sda1[0] sdb1[1]
          117153216 blocks super 1.2 [2/2] [UU]
          bitmap: 0/1 pages [0KB], 65536KB chunk
    
    unused devices: <none>

Conclusion

Problèmes connus

Voir aussi


Basé sur « Article » par Auteur.

QR Code
QR Code RAID 1 logiciel : Simuler une panne de disque et rétablir le RAID (generated for current page)