Un paio di giorni fa abbiamo ricevuto la notifica via email dal daemon di un server Debian GNU/Linux che ci informava senza alcun tatto di un disastro imminente. Il server in questione gestisce due dischi da 500GB/15k in RAID1 software ed uno dei due dischi ha deciso di fare testamento e mettersi in cammino per l’ultima, ineluttabile destinazione. La notifica non lasciava dubbi: la sincronizzazione con il disco /dev/sda non era più possibile a causa di ripetuti errori nella gestione della partizione /dev/sda1, urgeva quindi la sostituzione del disco.
L’intervento è andato liscio come l’olio, pertanto lo appunto qui a vantaggio di tutti, cercando di essere il più sintetico possibile.
Ecco i passaggi che hanno rimesso a nuovo il server:
1) per prima sono state marcate come failed le partizioni sda1 e sda2
mdadm --manage /dev/md0 --fail /dev/sda1
mdadm --manage /dev/md1 --fail /dev/sda2
2) poi le stesse partizioni sono state rimosse dai relativi array:
mdadm --manage /dev/md0 --remove /dev/sda1
mdadm --manage /dev/md1 --remove /dev/sda2
3) fatto questo, il server è stato spento e il disco sostituito:
shutdown -h now
4) una volta riavviato il server, sul nuovo disco sda sono state ricostruite le medesime partizioni presenti sul disco sdb:
sfdisk -d /dev/sdb | sfdisk /dev/sda
5) infine, sono stati aggiunti nuovamente le due partizioni all’array:
mdadm --manage /dev/md0 --add /dev/sda1
mdadm --manage /dev/md1 --add /dev/sda2
6) il resto del lavoro lo ha fatto egregiamente il server per conto suo, ricostruendo e rimettendo in pair il nuovo disco in circa 4 ore, durante le quali non è stato necessario interrompere in alcun modo il lavoro di chi quel server lo utilizza massicciamente per la gestione di progetti industriali…
… poi dicono che Linux è troppo difficile da utilizzare, va là va là… 🙂