Présentation
J'ai effectué de septembre 2007 à février 2011 un doctorat en informatique au sein des laboratoires d'Orange Labs, à Lannion, en collaboration avec l'Université d'Orléans et l'Université Pierre et Marie Curie (Paris 6).
Je m'intéresse plus particulièrement aux domaines de la recommandation automatique de contenu, la recherche d'information, l'analyse de sentiments, le traitement automatique de la langue ainsi qu'à la fouille de données par le biais de méthodes appartenant au domaine de l'apprentissage automatique.Formation
- 2011 : Thèse de Doctorat en Informatique intitulée "Des Textes Communautaires à la Recommandation"
). Soutenance effectuée au LIFO le 11 février 2011. Thèse en convention CIFRE entre l'entreprise Orange, le laboratoire d'Informatique Fondamentale d'OrlĂ©ans et le Laboratoire d'Informatique de Paris 6 sous la direction d'Isabelle Tellier et de Patrick Gallinari.
- 2007 : Master Informatique spĂ©cialitĂ© Modèles et Algorithmes, Université Bordeaux 1.
- 2005 : Licence Informatique, Université Bordeaux 1.
- 2004 : DEUG MIAS, Université Bordeaux 1.
- 2001 : Bac S, lycée Guez de Balzac, Angoulême (16).
Parcours professionnel
- Actuellement : ATER Ă l'UniversitĂ© d'OrlĂ©ans, chercheur au LIFO dans l'équipe CA.
- 2007 à 2010 : Ingénieur de Recherche à Orange Labs, Lannion.
- 2007 : Stage de fin d'étude à Orange Labs, Lannion. Sujet : "Analyse des sentiments dans des commentaires de films".
Résumé de thèse
La thèse concerne la transformation de données textuelles non structurées en données structurées et exploitables par des systèmes de recommandations.
Deux grandes catégories d'informations sont utilisées dans le domaine des moteurs de recommandation : les données descriptives de contenus comme les acteurs, le réalisateur ou le genre pour les films (filtrage thématique), et les données d'usages qui peuvent être, par exemple, des notes sur les produits consommés ou encore des pages internet visitées (filtrage collaboratif). D'autres données sont présentes sur le Web et ne sont pas encore réellement exploitées. Avec l'émergence du Web 2.0, les internautes sont de plus en plus amenés à partager leurs sentiments, opinions, expériences sur des produits, personnalités, films, musiques, etc. (par exemple sous forme de commentaires). Ces données textuelles produites par les utilisateurs représentent potentiellement des sources d'informations riches qui peuvent être complémentaires des données exploitées actuellement par les moteurs de recommandation et peuvent donc ouvrir de nouvelles voies d'études dans ce domaine en plein essor.
Notre objectif dans le cadre de la thèse est de produire, à partir des commentaires issus de sites communautaires (blogs ou forums), des matrices d'entrées pertinentes pour les systèmes de recommandation. L'idée sous jacente est de pouvoir enrichir un système pour un service débutant, qui possède encore peu d'utilisateurs propres, et donc peu de données d'usages, par des données issues d'autres utilisateurs.
Ce sujet recouvre plusieurs domaines. Il permet ainsi, entre autres choses, l'acquisition de connaissances liées aux Traitements Automatiques de la Langue, aux méthodes d'Apprentissage Automatique (classification supervisée et non supervisée), aux différents traitements et mesures de distances courant en Recherche d'Information ainsi qu'aux algorithmes de recommandation (filtrage thématique et collaboratif).
Publications
- - "Reperio: An Architecture for Recommendation in an Industrial Context" - dans Intelligent Techniques in Recommendation Systems: Contextual Advancements and New Methods, IGI Global Edition, 2011.
- - "Automating Opinion Analysis in Film Reviews: the Case of Statistic versus Linguistic Approach" - dans Affective Computing and Sentiment Analysis, Springer Edition, 2011.
- - "De la Classification d'Opinion Ă la Recommandation : l'Apport des Textes Communautaires" - dans Revue Traitement Automatique des Langues - TAL, 2011.

- - "Approches Statistique et Linguistique Pour la Classification de Textes d'Opinion Portant sur les Films" - dans Revue des Nouvelles Technologies de l'Information - RNTI-E-17, 2009.

- - "Reducing the Cold-Start Problem in Content Recommendation through Opinion Classification" - dans Proceedings IEEE/WIC/ACM International Conference on Web Intelligence, Toronto, Canada, 2010.

- - "Towards Text-Based Recommendations" - dans Proceedings RIAO 2010: International Conference on Adaptivity, Personalization and Fusion of Heterogeneous Information, Poster Session, Paris, France, 2010.

- - "Automating Opinion Analysis in Film Reviews: the Case of Statistic versus Linguistic Approach" - dans Proceedings LREC 2008, Workshop EMOT: Emotion, Metaphor, Ontology and Terminology, Marrakech, Maroc, 2008.

- - "La Classification d'Opinion comme préambule à la Recommandation Automatique de Contenus" - dans Proceedings CORIA-CIFED 2010 : COnférence en Recherche d'Information et Applications, Session jeunes chercheurs, Sousse, Tunisie, 2010.

- - "Analyse exploratoire d'opinions cinématographiques : co-clustering de corpus textuels communautaires" - dans Proceedings EGC 2008 : Extraction et Gestion des Connaissances, Sophia Antipolis, France, 2008
