Laboratoire de Génie Informatique et d’Automatique de l’Artois

Séminaire

Algorithmes de classification et de clustering basés sur le voisinage commun (SNN)

Le 13 janvier 2009 à 14h00 Salle des séminaires du LGI2A, FSA, Béthune
Guillem LEFAIT Doctorant LGI2A

La définition d’une fonction de similarité indirecte entre les données
dans les tâches de clustering ou de classification a deux buts
principaux : faire abstraction de la mesure de (dis)similarité
sous-jacente et accroitre la qualité des résultats en améliorant la
capacité de la mesure à rapprocher (resp. éloigner) les données de
même classe (resp. de classe différentes).

Nous présentons ici la mesure de similarité SNN qui définit une
relation de similarité entre deux données en s’appuyant sur le voisinage
partagé : deux données sont d’autant plus proches qu’elles partagent
les mêmes voisins.

Mots clefs : datamining, clustering, classification, snn, shared
nearest neighbors