Fils d'Ariane

University : Main content

Titre de page

Soutenance de thèse de Félix-Bazin POLLA DE NDJAMPA

Partager sur |

Contenu de la page principale

 Vidéo

Date -
Heure 10h00 - 13h00
Adresse

Laboratoire PRISME / VISIOCONFERENCE
Polytech Site Vinci - 8 rue Léonard de Vinci - Campus Université
France

Contact
Lien http://www.univ-orleans.fr/fr/univ/recherche/temps-forts/soutenances-de-theses-…

L’identification des actions simples de la vie quotidienne (comme marcher, s’asseoir ...) à partir des vidéos est important pour un système de reconnaissance d’activités humaines dont le but est l’amélioration de la sécurité et le confort des personnes. Cette thèse étudie le problème de la reconnaissance d’actions humaines en utilisant des images infrarouges basse résolution qui garantissent l’intimité des personnes surveillées. L’objectif principale de cette thèse est de tester et proposer des approches algorithmiques pouvant exploiter un type d’images assez particulières pour la reconnaissance d’actions dans une pièce. Notre première contribution concerne la proposition d’une chaîne d’analyse d’images thermiques adaptée au capteur utilisé. Pour ce faire, une étude de quelques méthodes de filtrage est faite dans le but d’éliminer les bruits des images en conservant le maximum d’informations, puis une méthode de segmentation à seuil adaptatif est proposée. Une méthode de post-traitement est également proposée pour combler les vides et éliminer les bruits dans les résultats de segmentation. Enfin, une étude comparative entre les méthodes de filtrage et les méthodes de segmentation est faite dans le but de trouver le couplage filtrage/segmentation) permettant de mieux extraire la silhouette de la personne dans les images. La seconde contribution est la proposition d’un modèle de reconnaissance d’actions qui représente une séquence vidéo en utilisant les distances entre les centres de gravité des formes segmentées, puis nous extrayons de cette représentation des attributs statistique savant de les passer au classifier KNN. Une autre étude est faite en proposant plusieurs modèles de reconnaissance d’actions utilisant comme représentation de séquence vidéo le MHI, puis des descripteurs pertinents sont extraits et combinés (les moments de HU, CHOP et les descripteurs géométriques) puis passé au classifieur. De ces études sont nées notre troisième contribution qui est la proposition d’un modèle en cascade comportant 3 classifieurs, nous permettant d’atteindre 89% de F-score sur la base que nous avons conçu pour cette étude. Pour valider nos résultats, une étude comparative est faite entre les approches d’apprentissages classiques et les approches d’apprentissages profonds. Nous terminons nos travaux en présentant la stratégie mise en place pour un système de reconnaissances d’actions dans des vidéos contenant plusieurs actions.