ANR JCJC TAILOR - TAILOR
Description
Les traitements médicaux personnalisés peuvent être modélisés par apprentissage par renforcement (RL). La personnalisation nécessite des données sensibles, créant une tension entre utilité et confidentialité. La confidentialité différentielle (DP) offre des garanties rigoureuses, mais les méthodes DP-RL actuelles souffrent de la barrière de composition : H mécanismes séquentiels, chacun satisfaisant epsilon-DP, composent en H.epsilon-DP. Avec l’hypothèse implicite de confidentialité uniforme sur tous
les retours, cela entraîne un regret élevé (utilité réduite).
Le projet TAILOR introduit la DP temporelle pour le RL adaptatif, exploitant que les besoins de confidentialité et la pertinence des retours évoluent dans le temps. En allouant le budget de confidentialité de façon adaptative, le projet vise à renforcer la protection là où nécessaire, tout en maintenant la meilleure utilité possible. Les défis incluent : la composition avec confidentialité variable et non-stationnarité, la conception de stratégies optimales d’allocation de budget, la démonstration de bornes
inférieures dépendantes des instances et la conception d’algorithmes DP-RL avec bornes supérieures correspondantes.
Méthodologie : (1) cadre hiérarchique formel de DP temporelle montrant des régimes où la confidentialité temporelle surpasse l’uniforme (2) bornes de composition améliorées pour non-stationnarité structurée (beta-mixing) (3) stratégies optimales d’allocation, incluant le "emprunt de budget" pour les phases critiques (4) algorithmes RL adaptatifs avec détection de points de changement basée sur la valeur et garanties démontrées, étendus à la DP temporelle fédérée (5) validation médicale sur maladies chroniques avec CHU Orléans et University of Michigan.
TAILOR établira les fondations de la DP temporelle, fournira des algorithmes pratiques pour un RL adaptatif respectueux de la confidentialité, et des méthodes garantissant la meilleure utilité possible en santé et autres domaines sensibles.