Le TALN a 50 ans et, si ses résultats ne sont pas très connus du grand
public, ils n'en sont pas moins considérables. Au fil des années, les
linguistes et les informaticiens ont appris à se connaître et à
travailler ensemble, et ils ont fait de beaux enfants. Beaucoup des
programmes, concepts et outils auxquels ont abouti ces collaborations
sont maintenant à la disposition de tous, notamment via le Web.
Il existe encore, apparemment, un fossé assez grand entre les théories
linguistiques et leurs usages concrets. Le dialogue homme-machine en
langage naturel ne s'est pas développé comme les pionniers de
l'intelligence artificielle l'avaient prédi et espéré. Pourtant,
l'ingénierie linguistique, en insistant sur la notion de ressources
autonomes, a comblé une partie de ce fossé. Au quotidien, nous ne
discutons peut-être avec aucune machine, mais en revanche nous
utilisons des gestionnaires de mails et des moteurs de recherches qui
intègrent certaines de ces ressources. En fait, le TALN est d'autant
plus présent dans les systèmes actuels qu'il y est invisible, un peu à
l'image de l'ensemble de l'"intelligence artificielle", elle aussi
intégrée "en douce" (via l'apprentissage automatique, notamment) à
nombre de logiciels contemporains.
Tout de même, au regard des méthodes d'analyses exposées dans nos
premiers chapitres, les outils réellement exploités dans les
applications de fouille de textes actuelles peuvent apparaître comme
assez rudimentaires. Très peu font appel à de la syntaxe ou à de la
sémantique. Pour ces systèmes, les techniques fondées sur des calculs
numériques sont souvent plus efficaces et fiables que celles basées
sur des modèles formels abstraits. Mais une mutation est en cours.
L'intégration des méthodes symboliques et statistiques est l'horizon
des recherches actuelles en TALN et en fouille de textes, en
intéraction aussi avec les travaux d'apprentissage automatique.
Il ne fait pas de doute que cette mutation portera des fruits dans les
années à venir. Et, étant donnés le développement d'Internet et la
multiplication des corpus électroniques accessibles, il ne fait pas de
doute non plus que ces fruits seront très utiles.