Thématique : Statistiques

Membres permanents : Didier Chauveau, Laurent Delsol, Richard Emilion, Diarra Fall, Sophie Jacquot,Marguerite Zani.

Description de la thématique

   La composition des membres de la thématique Statistique a évolué depuis le dernier rapport, avec le départ en retraite et Eméritat de Richard Emilion, et le recutements de Marguerite Zani (sur une thématique probabilité et statistiques).

Statistiques computationnelles, MCMC, mélanges de lois.

   D. Chauveau poursuit d'une part ses travaux sur la vitesse de convergence des MCMC à l'aide d'estimateurs par plus proches voisins de l'entropie en grande dimension ainsi qu'un package R de calcul parallèle en développement. Il participe également à plusieurs travaux sur la thématique des mélanges semi- et non-paramétriques: pour des données censurées aléatoirements en durées de vie avec L. Bordes; pour des mélanges multivariés avec relaxation de l'hypothèse usuelle d'indépendance conditionnelle dans le cadre de la thèse de Lynh Hoang; dans des contextes plus théoriques d'algorithmes EM lissés avec D. Hunter (Penn State University) et M. Levine (Purdue University); sur les tests statistiques pour les mélanges avec B. Garel et S. Mercier (Toulouse) dans la suite du PIA DURAREP2.

Statistique fonctionnelle et M-estimation.

   L'étude statistique de données assimilables à des courbes est actuellement en plein esssor. L. Delsol s'est intéressé à des modèles de régression sur variable fonctionnelle. Un article concerne la mise en place d'un test de non effet, tandis que la question du choix par validation croisée de la pseudo-métrique est discuté par C. Timmermans, L. Delsol et R. von Sachs. Plus récemment, L. Delsol et C. Louchet ont proposé une nouvelle méthode de segmentation d'images hyperspectrales combinant une approche bayésienne classique à des outils non-paramétriques fonctionnels. Dans le cadre d'une collaboration avec I. van Keilegom, L. Delsol a étudié les propriétés asymptotiques des M-estimateurs définis à partir de critères semi-paramétriques non lisses. Des résultats généraux concernant leur consistence, leur vitesse de convergence et leur loi asymptotique sont établis.

Statistique et informatique, Analyse de données symboliques.

   R. Emilion poursuit des travaux sur le calcul du nombre moyen de fermés d'une matrice aléatoire : avec C. Manga pour un Buffet indien généralisé de F. Caron, avec R. Belohlavek pour des coefficients flous. Il étudie également les réseaux Bayésiens de Dirichlet, avec E. Diday, les arbre de Walton Gatson pour des données textuelles, avec S. Regis, et un modèle de Dirichlet dépendant pour des donnés en lois. Il a organisé le workshop SDA2015 en analyse de données symboliques à Orléans (2015).

Statistiques bayésiennes non paramétriques.

   M.D. Fall a effectué ses travaux de recherche doctorale au CEA et au service hospitalier d'Orsay et s'est intéressée au développement de méthodes statistiques bayésiennes non paramétriques pour la reconstruction d'images 3D et 3D+t en TEP. Elle travaille également sur l'échantillonnage stochastique dans les espaces infini-dimensionnels et les modèles de mélange basés sur les arbres aléatoires. Au MAPMO, elle a débuté une collaboration avec R. Emilion, qui a conduit à l'organisation d'un workshop international sur la statistique bayésienne non paramétrique. Ils ont aussi démarré une collaboration avec des astronomes et astrophysiciens autour du projet LISA France. Elle travaille également avec L. Delsol, C. Louchet et C.Tauber (INSERM, Tours) sur la segmentation d'images TEP dynamiques par approche bayésienne et estimation par noyau.

Statistique des processus et théorèmes de grandes déviations.

   M. Zani étudie dans un article un principe de grandes déviations (PGD) pour des mesures empiriques associées à des carrés de processus stationnaires. Avec Jean-Marie Aubry, elle montre un PGD pour des statistiques de test qui sont des variables auto-normalisées, ainsi que l'efficacité asymptotique de Bahadur dans le cas homogène étudié par Shao. Dans un article récent à la mémoire de Marc Yor, M. Zani étudie des PGD pour des horloges de processus auto-similaires. C'est la généralisation de travaux plus anciens sur des PGD pour des estimateurs du max de vraisemblance de coefficients de diffusion dans le cas de processus d'Ornstein-Uhlenbeck radiaux et de Jacobi.

Applications et collaborations inter-disciplinaires.

   R. Emilion, D. Chauveau, L. Delsol et S. Jacquot on participé au projet FDTE (fouille de données environnementales avec le BRGM et le LIFO). D. Chauveau a participé au PIA DURAREP2 sur l'analyse de données liées à la fécondité des brebis (INRA Tours Nouzilly). Il a travaillé aussi avec le laboratoire Infosols, INRA d'Orléans sur l'analyse du taux de carbone des sols, et il collabore depuis 2015 avec des collègues biologistes (LBLGC Orléans et INRA) pour l'analyse du génome du peuplier (publication soumise courant 2016). Enfin, il va superviser un post-doc dans le cadre du PIA PALM sur la croissance des plantes (2016-2017). D. Fall développe une collaboration avec le laboratoire d'informatique (LIFO) et le Service Neurologie de l’hôpital d'Orléans autour de l'infarctus cérébral aigu.