Conclusion

Conclusion

Le TALN a 50 ans et, si ses résultats ne sont pas très connus du grand public, ils n'en sont pas moins considérables. Au fil des années, les linguistes et les informaticiens ont appris à se connaître et à travailler ensemble, et ils ont fait de beaux enfants. Beaucoup des programmes, concepts et outils auxquels ont abouti ces collaborations sont maintenant à la disposition de tous, notamment via le Web.

Il existe encore, apparemment, un fossé assez grand entre les théories linguistiques et leurs usages concrets. Le dialogue homme-machine en langage naturel ne s'est pas développé comme les pionniers de l'intelligence artificielle l'avaient prédi et espéré. Pourtant, l'ingénierie linguistique, en insistant sur la notion de ressources autonomes, a comblé une partie de ce fossé. Au quotidien, nous ne discutons peut-être avec aucune machine, mais en revanche nous utilisons des gestionnaires de mails et des moteurs de recherches qui intègrent certaines de ces ressources. En fait, le TALN est d'autant plus présent dans les systèmes actuels qu'il y est invisible, un peu à l'image de l'ensemble de l'"intelligence artificielle", elle aussi intégrée "en douce" (via l'apprentissage automatique, notamment) à nombre de logiciels contemporains.

Tout de même, au regard des méthodes d'analyses exposées dans nos premiers chapitres, les outils réellement exploités dans les applications de fouille de textes actuelles peuvent apparaître comme assez rudimentaires. Très peu font appel à de la syntaxe ou à de la sémantique. Pour ces systèmes, les techniques fondées sur des calculs numériques sont souvent plus efficaces et fiables que celles basées sur des modèles formels abstraits. Mais une mutation est en cours. L'intégration des méthodes symboliques et statistiques est l'horizon des recherches actuelles en TALN et en fouille de textes, en intéraction aussi avec les travaux d'apprentissage automatique.

Il ne fait pas de doute que cette mutation portera des fruits dans les années à venir. Et, étant donnés le développement d'Internet et la multiplication des corpus électroniques accessibles, il ne fait pas de doute non plus que ces fruits seront très utiles.