Des motifs à leur exploration : comment prendre en compte l'intérêt d'une experte

Séminaire organisé par Etienne LEHEMBRE (LIFO) le 12/01/2025.

Résumé :

Mes travaux de thèse aborde le rôle d'une experte dans l'évaluation de l'intérêt des motifs structurés ainsi que la caractérisation d’éléments remarquables dans un ensemble de motifs dans le cadre de la chémoinformatique.

La première concerne l'extraction de motifs dont les caractéristiques sont jugées surprenantes vis-à-vis d’un ensemble de motifs étudiés et de leur jeu de données. Ainsi, les motifs obtenus constituent pour l'experte des points d'entrée pour le début d’une analyse comparative mettant en relief les motifs et leur qualité afin de faire ressortir leur pertinence locale. Nous définissons un motif comme remarquable si sa qualité diverge suffisamment de son voisinage. En chémoinformatique, les motifs sélectionnés constituent un ensemble de motifs dont les fonctions biologiques s'avèrent surprenantes pour les expertes.

La seconde partie présente une méthode d'exploration interactive nommée WaveLSea (Wave top-k random-d Lineage Search) dont la particularité est qu'elle ne nécessite pas la déclaration de descripteurs sur les données explorées. Pour un ensemble de motifs donné, cette méthode a pour but d’orienter une experte dans son exploration de manière itérative.

La troisième partie aborde une amélioration des méthodes d'évaluation des algorithmes de fouille interactive. Cette amélioration se fait à travers l'introduction d'erreurs contrôlées permettant d'évaluer la robustesse de ces algorithmes. Ainsi, les algorithmes de fouille interactive ne sont plus évalués avec des oracles ne commettant jamais d'erreurs, mais avec des devins dont le comportement se rapproche de celui d'un humain.