Tag Archive for Oups

« Oups. »

C’est ce que je me suis dit lors d’un incident il y a deux jours chez un client.

Cas pratique : un des intervenants sur site a préparé un poste destiné à servir de master de déploiement. Plutôt maousse, le master : 75 Go. Mon rôle consiste ensuite à prendre la machine (un Mac mini), appliquer les derniers réglages, puis faire une image-disque à partir de ce poste master.

Plutôt facile en temps normal : j’utilise le logiciel Deploy Studio, qui est d’une puissance phénoménale pour assurer un déploiement rapide et très souple en environnement Apple. En le combinant avec la technologie NetBoot d’OS X Server, on peut facilement créer les masters et tout aussi simplement les appliquer sur de nouveaux postes.

Confiant, je démarre donc le poste master en Netboot, puis je me prépare à créer le master.

Sauf que je vois alors l’interface de Deploy Studio ne pas me laisser la main, et lancer automatiquement un workflow.

Dans ce workflow, la première action est…

Formater le disque.

OUPS.

Je débranche le poste en urgence, et je redémarre.

Point d’interrogation au démarrage.

Là, le OUPS se transforme en GLOUPS. Car un master de ce type prend énormément de temps à préparer, et comme c’est un master, on n’a pas forcément de sauvegarde de ce poste.

Deploy Studio avait été programmé quelques semaines auparavant pour préparer automatiquement les nouveaux postes qui démarreraient sur l’image-disque de Netboot. Le déploiement avait été fait, et tout avait été fait pour minimiser au possible les interactions.

Autrement dit, c’est la catastrophe… Diskwarrior ne pourra pas faire grand chose dans ce cas. Data Rescue ? Déjà testé sur un disque, il est puissant, mais il va sûrement me récupérer tous les fichiers « en vrac », sans les bons noms, l’arborescence sera explosée… Donc pas beaucoup mieux. J’ai suivi une formation de récupération de données, et je sais que le formatage du disque, s’il permet de récupérer les données, ne permettra pas forcément de récupérer l’arborescence en l’état.

Je préviens l’intervenant qui a préparé l’image.

« Tu déconnes, tu veux me faire marrer là ? ».

Euh, non, j’ai plein d’histoires drôles, mais là, j’en ai pas en stock. Et c’est encore moins drôle quand il m’explique qu’il n’a pas les originaux de tous les fichiers d’exemple et autres documentations qu’il a directement téléchargés sur le poste.

Oups oups oups.

Je préviens alors le directeur du problème. Heureusement, il est philosophe… « Seuls ceux qui ne font jamais rien ne font pas d’erreur ».

C’est vrai, mais quand même. Ça agace, ça énerve. Et ça veut dire qu’on risque d’avoir encore un retard conséquent sur ce déploiement.

Malgré tout, et malgré l’avis d’un de mes confères qui pensait qu’il serait impossible de récupérer le contenu du disque, je récupère la machine et je branche le Mac mini en mode Target sur mon fidèle Mac Pro, et je lance Data Rescue. La nuit va être longue…

Le lendemain matin, vérification faite auprès de Data Rescue.

OH ?

OH OH OH !!!

OOOOOOOOOOOOOOOOOOOOOHHHHHHHHHHH !!!

Data Rescue semble avoir été capable de récupérer tous les fichiers ET l’arborescence complète !

Je lance la récupération des fichiers sur un disque externe, puis je recopie tout sur un autre volume. Bon, évidemment, le Mac ne redémarre pas, mais après réparé les autorisations, je lance une réinstallation d’OS X 10.8 via la récupération Internet…

Le Mac redémarre, et pratiquement tous les fichiers sont utilisables !

Je teste le lancement de toutes les applications… Tout se lance, pas  de plantage.

Champagne !

Conclusions de cette histoire :

  • Je ne suis pas infaillible. Mais ça, on le savait déjà.
  • Heureusement, j’ai parfois des clients très cools.
  • Même quand vous faites un master, faites TOUJOURS une sauvegarde de ce dernier. Ici nous avons eu une expérience humaine malheureuse, mais ça aurait pu être une panne matérielle ou logicielle qui aurait fait perdre un temps conséquent.
  • Quand vous utilisez une fonction de déploiement automatique qui efface par défaut les disques, pensez à la désactiver quand elle est devenue inutile…
  • Quand on fait une connerie, autant être honnête et l’assumer. Je ne pense pas qu’il aurait été pertinent de tenter de garder ça sous le tapis. L’erreur était essentiellement la mienne.
  • Assumer son erreur, c’est aussi mettre en œuvre ce qu’il faut pour que la situation désagréable soit corrigée rapidement.
  • Data Rescue est bien plus puissant encore que ce que je pensais. Et dans ce cas précis (formatage d’un disque par erreur), c’était l’outil le plus adapté, même si Diskwarrior fait souvent des miracles. Evidemment, il fallait être très rapide dès le problème détecté, et si l’ancien master avait été appliqué sur le poste, c’était fini…

Conclusion de la conclusion :

Parfois, j’ai du pot. Beaucoup.