Lifo - Laboratoire d'Informatique Fondamentale d'orléans INSA Centre Val de Loire Université d'Orléans Université d'Orléans

Lifo > Les Actions de Recherche du LIFO > Action de Recherche : ANR PARSEME-FR

 English Version



Contact

LIFO - Bâtiment IIIA
Rue Léonard de Vinci
B.P. 6759
F-45067 ORLEANS Cedex 2

Email: contact.lifo
Tel: +33 (0)2 38 41 70 11
Fax: +33 (0)2 38 41 71 37



ANR PARSEME-FR : Analyse syntaxique et expressions polylexicales en français

Le projet ANR PARSEME-FR, porté par le LIGM Marne-La-Vallée, a pour but d'améliorer la précision linguistique et l'efficacité computationnelle d'applications du traitement automatique des langues (TAL), et en particulier l'analyse syntaxique et ses liens avec l'analyse sémantique. Le projet se concentre sur un des verrous principaux de ces applications: les expressions polylexicales (MWE), i.e. des groupes de mots avec un certain degré d'idiomaticité comme "mémoire vive","cinquième colonne", "Banque centrale européenne", "au pied levé" ou "prendre le taureau par les cornes". Malgré des avancées significatives ces dernières années, l'état-de-l'art concernant les MWE est largement insatisfaisant. Les travaux actuels sur ces expressions se concentrent essentiellement sur la création de lexiques ou sur leur reconnaissance automatique dans des textes. Seules quelques approches ont cherché à créer un lien entre expressions polylexicales et analyse profonde automatique de textes. Ces approches confirment qu'un traitement approprié des MWEs améliore à la fois la précision linguistique et la robustesse. Cependant, elles sont principalement limitées à quelques classes de MWE et à l'analyse syntaxique. Cet état insatisfaisant est principalement du au manque de ressources linguistiques incluant des informations profondes sur les MWE qui alimenteraient les analyseurs linguistiques. En Français, de telles ressources existent mais elles sont incomplètes en termes de représentation syntaxique et sémantique, de couverture et/ou d'adéquation avec les outils du TAL.
Dans ce projet, nous proposons de combler ces lacunes en étudiant la représentation syntaxique et sémantique des expressions polylexicales dans les ressources linguistiques utilisables en TAL, ainsi que l'intégration de l'analyse des MWE dans des analyseurs syntaxiques et ses liens avec l'analyse sémantique et pragmatique. Les délivrables attendus incluent des ressources linguistiques améliorées (lexiques, grammaires, corpus annotés), des analyseurs syntaxiques (profonds) et des outils liant les MWE reconnus à des bases de connaissances linguistiques ou du monde. Cette proposition est une spin-off nationale de l'action européenne COST IC1207 PARSEME sur le même sujet.

Participants

Denys DUCHIER

Yannick PARMENTIER

Page web de l'action