Laboratoire de Génie Informatique et d’Automatique de l’Artois

Seminar

Clustering distribué en deux phases

The 17 January 2008 at 14:00 Seminars room of the LGI2A, FSA, Béthune
Guillem LEFAIT Ph.D. student LGI2A
The seminar is held in french.

L’objectif du clustering distribué est de partitionner un ensemble de
données réparties sur plusieurs sites dans un certain nombre de
groupes en limitant le nombre de communications entre les sites.

Nous présenterons un algorithme en deux étapes basé sur la compression
des différents jeux de données puis la fusion de ces jeux de données
compressés.

L’étape de compression est basée sur la découverte de points de
gravité qui garantissent une homogénéité de densité dans la zone
d’attraction.

L’étape de fusion est basée sur SKNN, un algorithme de
clustering utilisant la notion de voisinage commun pour définir les
relations entre les données.