Extraction des règles d'urbanisme dans le contexte du projet ANR Hérelles

[VISIO] Séminaire organisé par Maksim Koptelov (INRIA Saclay) le 19/03/2025.

Résumé :

L'artificialisation des sols est un problème moderne important car elle est irréversible, réduisant les sols agricoles et causant des problèmes environnementaux. Notre projet, ANR Hérelles, a pour ambition de répondre à ce défi en développant un cadre pour la gestion de l'artificialisation des sols. L'un des objectifs d'Hérelles est de trouver de nouveaux mécanismes pour faciliter l'étiquetage (ou la sémantisation) des clusters à partir de séries temporelles d'images satellites. Pour y arriver, une solution proposée consiste à associer des éléments textuels d'intérêt aux clusters extraits. La première étape de ce processus est l'extraction automatique des informations sous forme de règles à partir de documents d'urbanisme en français.
Dans ce travail, nous proposons une méthode basée sur la classification multi-étiquettes de segments textuels et leur résumé consécutif. Nous développons plusieurs techniques d'augmentation de texte pour les textes français, capables d'améliorer les résultats de prédiction.
Enfin, nous adaptons une approche basée sur les graphes AMR (Abstract Meaning Representation) pour générer les résumés des règles et effectuons une analyse comparative avec ChatGPT. Nos résultats indiquent que ChatGPT surpasse l'approche basée sur l'AMR, ce qui conduit à une discussion sur les avantages et les limites des deux méthodes et à une proposition de développement d'une nouvelle approche hybride qui combinerait les avantages de ces deux approches.