Détermination du type de panne de périphérique

Le terme périphérique endommagé peut décrire un grand nombre de situations :

Bit rot : sur la durée, des événements aléatoires, tels que les influences magnétiques et les rayons cosmiques, peuvent entraîner une inversion des bits stockés dans le disque. Ces événements sont relativement rares mais, cependant, assez courants pour entraîner des corruptions de données potentielles dans des systèmes de grande taille ou de longue durée.

Lectures ou écritures mal dirigées : Les bogues de microprogrammes ou les pannes de matériel peuvent entraîner un référencement incorrect de l’emplacement du disque par des lectures ou écritures de blocs entiers. Ces erreurs sont généralement transitoires, mais un grand nombre d’entre elles peut indiquer un disque défectueux.

Erreur d’administrateur :  Les administrateurs peuvent écraser par erreur des parties du disque avec des données erronées (la copie de /dev/zéro sur des parties du disque, par exemple) qui entraînent la corruption permanente du disque. Ces erreurs sont toujours transitoires.

Interruption temporaire de service : un disque peut être temporairement indisponible, entraînant l’échec des E/S. En général, cette situation est associée aux périphériques connectés au réseau, mais les disques locaux peuvent également connaître des interruptions temporaires de service. Ces erreurs peuvent être transitoires ou non.

Matériel défectueux ou peu fiable : cette situation englobe tous les problèmes liés à un matériel défectueux, y compris les erreurs d’E/S cohérentes, les transports défectueux entraînant des corruptions aléatoires ou des pannes. Ces erreurs sont typiquement permanentes.

Périphérique mis hors ligne :  si un périphérique est hors ligne, il est considéré comme ayant été mis hors ligne par l’administrateur, parce qu’il était défectueux. L’administrateur qui a mis ce dispositif hors ligne peut déterminer si cette hypothèse est exacte.

Il est parfois difficile de déterminer la nature exacte de la panne du dispositif. La première étape consiste à examiner le décompte d’erreurs dans la sortie de zpool status.

Partager :