Laboratoire de Génie Informatique et d’Automatique de l’Artois

Thèse de Sebastien RAMEL

Régression logistique crédibiliste : application à l’étalonnage actif de classifieurs et extension choquistique

Date de début : 3 octobre 2016
Financement : thèse université Artois/ Region
Mots clés : Fonctions de croyance, Régression choquistique, Intégrale de Choquet, Régression logistique, Classification monotone, Classification fiable, Incertitude épistémique, Apprentissage actif
Encadrement :

La régression logistique est un modèle de classification bien établi, dont la monotonie a contribué à sa popularité. Cependant, elle présente au moins deux faiblesses. Premièrement, elle manque d’une conscience de soi, c’est-à-dire une aptitude à représenter l’ignorance (aussi connue sous le nom d’incertitude épistémique ou réductible) impliquée dans ses prédictions, ce qui est crucial dans des problèmes de classification critiques. Récemment, une extension de la régression logistique a été introduite pour pallier ce problème et a été appliquée à l’étalonnage de classifieurs. Cette extension est formalisée dans le cadre de la théorie de l’évidence et repose en particulier sur une méthode pour l’inférence statistique et la prédiction développée dans ce cadre. La première contribution de cette thèse est d’étudier l’intérêt de cette extension pour l’apprentissage actif dans le contexte de l’étalonnage de classifieurs. Une stratégie d’échantillonnage par incertitude reposant sur l’ignorance est proposée et validée expérimentalement. Une seconde faiblesse de la régression logistique est qu’elle manque de flexibilité, c’est-à-dire une aptitude à capturer des dépendances non linéaires entre les prédicteurs. Pour traiter ce problème, une généralisation élégante de la régression logistique reposant sur l’intégrale de Choquet et appelée régression choquistique, a été proposée. Elle préserve la monotonie de la régression logistique tout en s’affranchissant de sa linéarité. Toutefois, comme la régression logistique, elle manque d’une conscience de soi. La deuxième contribution de cette thèse est de remédier à ce problème en dérivant une extension de la régression choquistique basée sur la théorie de l’évidence, similaire à l’extension crédibiliste de la régression logistique. L’utilité de l’approche obtenue est confirmée empiriquement dans des problèmes de classification où la prudence dans la prise de décision est permise.

Inscrite dans le projet régional ELSAT2020 (VUMPOE), cette thèse est financée en partie par le projet ELSAT2020, qui est cofinancé par l’Union européenne avec le Fonds européen de développement régional, l’État français et le Conseil régional des Hauts de France.

Thèmes scientifiques impliqués :

Domaines d'application impliqués :

Partenaires

Soutenance

Soutenance ayant eu lieu le 05/06/2020 à 10:00 Salle Prestige, Faculté des Sciences Appliquées de Béthune

Jury :

  • Rapporteur Michèle ROMBAUT Université Grenoble Alpes
  • Rapporteur Benjamin QUOST UTC
  • Président Olivier COLOT Université de Lille
  • Examinateur Sébastien DESTERCKE UTC, CNRS