Le Muséum National d’Histoire Naturelle

Créé en 1635 par un décret royal, ce qui était au départ le jardin des plantes du roi devient le Muséum National d’Histoire Naturelle en 1793. Fort d’une expertise reconnue, ses missions couvrent la conservation et l’enrichissement de collections exceptionnelles, la recherche, l’enseignement et la diffusion des savoirs auprès du public. Deux mille personnes travaillent au Muséum, dont 500 chercheurs, aidés dans leurs tâches par la direction des services informatiques (DSI) dirigée par Henri Michiels.  La DSI gère plus de deux mille postes de travail, 120 serveurs physiques ou virtuels répartis dans trois salles informatiques situées sur le Jardin des Plantes et interconnectées par fibre optique, ainsi que les moyens de stockage.

La numérisation de l’herbier bouscule les besoins

Les besoins de stockage évoluent de façon importante depuis 2004, quand la numérisation systématique des spécimens de collections commence, générant de nombreuses images de taille allant de quelques Mo à près de 200 Mo. Pour répondre à ce besoin, le choix s’est porté sur un réseau SAN à base de fibres optiques supportant le protocole Fibre Channel, qui interconnecte les trois salles informatiques situées au Jardin des Plantes. Sur ce réseau sont connectés des baies de stockage SAN, ainsi que les serveurs. Un système de sauvegarde sécurise l’ensemble des données. Mais le projet de rénovation du Grand Herbier initié en 2009 bouscule cette architecture. Le Grand Herbier, qui remonte au 17ème siècle est le plus grand du monde avec celui de Londres, avec près de 10 millions de planches au format A3. Le projet de rénovation comprend le reconditionnement des planches, l’intégration des spécimens en attente, la réorganisation des collections et bien sûr la numérisation, indispensable à la diffusion de la connaissance. La projection du volume à stocker avoisine les 500 teraoctets !

L’extension du SAN n’est pas possible

Le stockage est tout d’abord envisagé sur le SAN, mais une étude de coût montre que cette solution n’est pas envisageable économiquement compte tenu des budgets et des volumes prévus pour l’herbier. «  Nous avons rapidement écarté la solution à base de SAN, car le coût au Go est trop élevé et il faut le doubler d’une sauvegarde, et donc ajouter des coûts supplémentaires de logiciel et de matériel de stockage » déclare Henri Michiels, directeur informatique du Muséum National d’Histoire Naturelle.

Recherche très grand stockage à faible coût

Le besoin de stockage est remis à plat par l’équipe informatique : les données doivent être accessibles en permanence, mais un temps de latence est acceptable. Elles doivent être protégées sans faire appel au système de sauvegarde hebdomadaire classique, qui n’est pas adapté à ces données qui ne sont pas modifiées. Mais sans sacrifier la sécurité, car la perte de ces données originales n’est pas envisageable, il n’existe pas de copie ! Et côté infrastructure, le système doit permettre la conservation à très long terme, et avoir un coût minimal au Go à la fois en acquisition et en fonctionnement, ce qui implique de consommer peu d’énergie électrique. En bref, un système de stockage pérenne, ouvert, sécurisé et très peu coûteux… cette équation semble difficile  à résoudre…