Blog de Blog4ever

Retour sur la coupure des fichiers entre le 14 et le 22 Février

Chers blogueurs,

 

Voici un récapitulatif de la panne qu'il y a eu du Dimanche 14 Février en soirée au Lundi 22 Février concernant les fichiers des blogs.

 

L'origine de la coupure

Tous les fichiers des blogs sont situés sur un gros serveur avec plusieurs disques durs qui s'entrecopient des données (système appelé RAID5) afin qu'en cas de défaillance on puisse changer un disque dur sans perdre aucune donnée et sans coupure.

En parallèle, toutes les données sont sauvegardées quotidiennement sur un serveur de backup.

Tous les disques durs utilisés sont certifiés pour être très fiables et ne tomber en panne que très rarement.

 

Cependant, Dimanche 14 Février il y a eu une panne quasi-simultanée sur 2 des disques durs du serveur de fichiers, puis juste après sur le disque dur du serveur de backup. Cette situation avait une probabilité extrêmement faible d'arriver et aucun signe ne nous laisser penser qu'elle arriverait car les serveurs fonctionnaient parfaitement.

 

La phase de réparation

Pour rétablir les fichiers il a fallu transférer les données de ces 2 serveurs sur 2 autres serveurs avec des disques durs non défaillants.

Cela a pris énormément de temps car il y a des millions de fichiers et on devait utiliser des techniques qui ne risquaient pas de perdre des données.

 

La majorité des fichiers était restaurée Vendredi et le reste des fichiers a été restauré Lundi. 

 

Les prochaines étapes

Normalement tous les fichiers sont restaurés. S'il vous manque des fichiers, n'hésitez pas à nous écrire.

 

Nous allons faire évoluer notre infrastructure pour diminuer le risque de coupure et surtout minimiser le temps de restauration en cas de problème.

 

Concrètement il s'agit de :

- répliquer encore plus les données (par exemple sur un autre serveur de fichiers lui aussi des disques durs qui s'entrecopient)

- éclater les données sur plusieurs petits serveurs, comme ça s'il y a un problème on ira plus vite pour restaurer

 

Nous allons aussi faire un audit des autres serveurs pour nous assurer qu'une telle situation ne peut pas leur arriver.

 

Nous sommes vraiment désolés pour cette panne qui a duré trop longtemps et qui a grandement impacté vos blogs. Nous allons faire le maximum pour que cela se reproduise jamais.

 

Merci à tous pour votre patience et votre soutien pendant cette période compliqué et stressante.

Cela fait vraiment chaud au coeur de voir à quel point la communauté Blog4ever est fidèle et cela nous encourage à redoubler d'effort pour améliorer la plateforme !

 

Voici un sujet qui détaille plus précisément les différentes étapes de la coupure et les solutions techniques en train d’être mises en place pour que ce type de coupure ne se reproduise pas.

 

Très bonne semaine à tous.



23/02/2016
30 Poster un commentaire

Inscrivez-vous au blog

Soyez prévenu par email des prochaines mises à jour

Rejoignez les 363 autres membres