Laboratoire de Génie Informatique et d’Automatique de l’Artois

Séminaire

Clustering distribué en deux phases

Le 17 janvier 2008 à 14h00 Salle des séminaires du LGI2A, FSA, Béthune
Guillem LEFAIT Doctorant LGI2A

L’objectif du clustering distribué est de partitionner un ensemble de
données réparties sur plusieurs sites dans un certain nombre de
groupes en limitant le nombre de communications entre les sites.

Nous présenterons un algorithme en deux étapes basé sur la compression
des différents jeux de données puis la fusion de ces jeux de données
compressés.

L’étape de compression est basée sur la découverte de points de
gravité qui garantissent une homogénéité de densité dans la zone
d’attraction.

L’étape de fusion est basée sur SKNN, un algorithme de
clustering utilisant la notion de voisinage commun pour définir les
relations entre les données.