SEM

Un segmenteur-étiqueteur basé sur les CRF, licence GNU.


Ces scripts n'ont été testés que sur les systèmes Debian, Ubuntu et Mac. Ils risquent probablement de ne pas fonctionner sous Windows.



Les deux programmes suivants doivent être installés sur votre ordinateur pour pouvoir lancer l'étiqueteur :
  - python, le tagger étant codé dans ce langage.
  - wapiti de Thomas Lavergne. Ce programme sera lancé pour effectuer l'étiquetage syntaxique du fichier donné en paramètre.
  - bazaar pour pouvoir récupérer la branche "stand alone" en copiant l'instruction suivante dans un terminal : bzr branch lp:~yoann-dupont/crftagger/stand-alone-tagger (approximativement 15000KB)


Un fichier readme est également disponible avec la branche de bazaar pour expliquer comment lancer l'étiqueteur.