Gestion de données

J'ai travaillé sur le problème du passage à l'échelle dans la gestion des données dans les architectures distribuées avec un double objectif : pouvoir stocker de grandes quantités de données, typiquement des péta-octets, ainsi qu'exploiter des architectures distribuées à grande échelle, tant en terme de nombre de n\oe uds que géographique, comme des grappes ou des grilles.

Les travaux principaux que j'ai menés dans ce cadre sont :

la conception de deux systèmes de gestion de données grande échelle pour grille composé de deux systèmes fichiers, un pour grappe, NFSP, et un pour grille, NFSG, ainsi qu'un outil de transfert de fichiers, GXFER, qui exploite le parallélisme du stockage et les multiples liens de communication existant entre deux sites au sein d'une grille afin d'augmenter les performances du transfert.
l'optimisation des entrées/sorties sur grappes afin d'ordonner et ordonnancer les requêtes d'entrées/sorties entre les différents nœuds de calcul d'une grappe et le, ou les, serveur de données. Le prototype résultant est aIOLi.

Je collabore également à un projet sur la fouille de données, pour la catégorisation d’un grand ensemble de données, qui utilise les architectures de grilles pour passer à l’échelle en terme de volume des données classifiables.

Espace personnel de Yves Denneulin