Atelier sur la quantification de l'incertitude et la causalité

Atelier Culture scientifique
Le 18 mars 2026

du programme Mercredi 18 mars 2026
9 h 00 – 17 h 30 

Intervenants

Irène Balleli,
Centre Inria d'Université Côte d'Azur, équipe/projet EPIONE

Titre : Vote, ensembling et découverte de causalités au niveau de la population : quelle contribution peut apporter un public d'experts et comment ?

Résumé :La découverte de relations de cause à effet fiables à partir de données réelles est un défi extrêmement complexe qui reste à relever. Les algorithmes existants de découverte de causalité (CD), même lorsqu'ils sont théoriquement identifiables, reposent sur des hypothèses strictes qui sont rarement remplies dans des scénarios complexes du monde réel, telles que la forme fonctionnelle des relations causales, la famille de distribution des données et la suffisance causale. En conséquence, la fiabilité de ces algorithmes peut considérablement diminuer, compromettant l'interprétabilité des résultats et la fiabilité des décisions en aval. Et si, au lieu de nous fier à un seul expert en CD et à sa compréhension partielle du véritable mécanisme causal sous-jacent, nous consultions un groupe d'experts ? Dans cette présentation, je vais présenter et discuter trois stratégies principales pour parvenir à un consensus d'experts sur la découverte causale : le vote, l'assemblage et l'analyse basée sur la population. Je mettrai en évidence le niveau d'informations supplémentaires que chacune des stratégies envisagées peut fournir par rapport à une approche traditionnelle basée sur un seul expert, et je décrirai comment ces stratégies peuvent être mises en œuvre efficacement, en commençant par le goulot d'étranglement de la communication entre les experts. Je présenterai certains résultats issus d'études de simulation contrôlées et d'une application concrète sur les perturbations génétiques du cancer du poumon, qui démontreront l'efficacité d'un public d'experts pour renforcer les points forts de chaque expert tout en atténuant leurs incertitudes.
Victor Elvira,
Université d'Édimbourg

Titre :Modèles d'espace d'état structurés en graphes au-delà de la dynamique linéaire

Résumé : La modélisationet l'inférence dans les séries chronologiques multivariées sont des problèmes centraux en statistique, en traitement du signal et en apprentissage automatique. Un défi récurrent consiste à comprendre et à représenter les relations dirigées entre les composants d'un système dynamique, soit au niveau des signaux observés, soit au niveau des états latents. La modélisation graphique combinée à des contraintes de parcimonie fournit un langage naturel pour encoder une telle structure, limiter la croissance des paramètres et améliorer l'interprétabilité. Dans cette présentation, nous adoptons le point de vue selon lequel les modèles d'espace d'état peuvent être interprétés comme des systèmes dynamiques structurés en graphes, où les arêtes encodent les dépendances dans l'évolution latente. Nous revisitons d'abord brièvement le cadre linéaire gaussien, où les opérateurs de transition et les covariances de bruit induisent des graphes orientés clairsemés. Nous nous concentrons ensuite sur les extensions non linéaires, en montrant comment cette vision basée sur les graphes peut être étendue au-delà de la dynamique linéaire à l'aide de modèles probabilistes différentiables. En particulier, nous introduisons GraphGrad, un cadre qui permet d'apprendre la dynamique latente structurée en graphes dans des modèles d'espace d'état non linéaires via une inférence basée sur les gradients. Cette approche préserve l'interprétabilité tout en étendant l'identification des systèmes basés sur les graphes à des contextes avec une dynamique non linéaire et des modèles d'observation complexes.
 
Aurore Lomet,
CEA Saclay LIAD

Titre :Mise à l'échelle de l'IA causale pour la simulation FEM sismique

Résumé : Cetteprésentation traite de l'évolutivité d'une approche de découverte causale pour les séries chronologiques multivariées dans le contexte de l'assimilation des données sismiques. L'approche proposée repose sur des tests d'indépendance conditionnelle basés sur le noyau, en particulier le critère d'indépendance de Hilbert-Schmidt (HSIC). Alors que les mesures de dépendance telles que le HSIC sont couramment utilisées dans la quantification de l'incertitude pour quantifier l'influence entre les entrées et les sorties, elles sont ici utilisées pour des tests d'indépendance afin de déduire des graphes temporels orientés à partir des données des capteurs tout en limitant les hypothèses de distribution.
Comme les méthodes basées sur le noyau nécessitent la construction de matrices de Gram qui limitent l'évolutivité pour les séries chronologiques longues, une approximation aléatoire des caractéristiques de Fourier est utilisée pour réduire le coût de calcul. La procédure d'inférence est également portée sur GPU pour prendre en charge une exécution haute performance.
 
Qingyuan Zhao,
Université de Cambridge

Titre :Une perspective contrefactuelle de l'héritabilité, de l'explicabilité et de l'ANOVA

Résumé :Les outils existants pour expliquer des modèles et des systèmes complexes sont associatifs plutôt que causaux et ne fournissent pas de compréhension mécanistique. Inspiré par le concept d'héritabilité génétique dans les études sur les jumeaux, cet exposé présentera une nouvelle notion appelée « explicabilité contrefactuelle » pour l'attribution causale. Elle peut être considérée comme une extension de l'analyse de sensibilité globale (ANOVA fonctionnelle et indices de Sobol), qui suppose des variables explicatives indépendantes, à des variables explicatives dépendantes dont la relation causale peut être décrite par un graphe acyclique dirigé. Cette nouvelle notion sera illustrée à l'aide de plusieurs exemples artificiels et réels. Cette présentation est basée sur des travaux conjoints avec Zijun Gao, Haochen Lei et Hongyuan Cao.

Courtes discussions : 

Agathe Fernandes Machado,
UQAM, Montréal (Québec, Canada)

Titre :Analyse de médiationcausalevia le transport séquentiel pour évaluer l'équité contrefactuelle

Résumé : L'équité algorithmique désigne un ensemble de principes et de techniques visant à garantir que les décisions produites par un algorithme sont équitables et non discriminatoires envers tous les utilisateurs, indépendamment de leurs caractéristiques personnelles telles que le sexe, l'origine ethnique ou d'autres attributs dits sensibles. Son évaluation peut être effectuée au niveau individuel en se concentrant sur une personne spécifique issue d'un groupe minoritaire et en posant des questions contrefactuelles telles que : « Quel serait le salaire de cette femme si elle était un homme ? » Pour évaluer l'injustice d'un modèle d'apprentissage automatique, nous adoptons la notion d'équité contrefactuelle proposée par Kusner et al. (2017). Nous introduisons un cadre distributionnel pour l'analyse de médiation causale basé sur le transport optimal (OT) et son extension séquentielle le long d'un graphe acyclique dirigé (DAG) médiateur, dans lequel l'attribut sensible correspond à la variable de traitement. Plutôt que de nous appuyer sur des contrefactuels structurels intermondiaux, nous construisons des contrefactuels médiateurs dans un sens mutatis mutandis : les médiateurs ne sont modifiés que dans la mesure nécessaire pour aligner un individu sur la distribution dans le cadre du traitement alternatif, tout en respectant les dépendances causales entre les médiateurs. Le transport séquentiel (ST) construit ces contrefactuels en appliquant des cartes OT univariées ou conditionnelles suivant un ordre topologique du DAG du médiateur, et s'étend naturellement aux médiateurs catégoriels grâce à des techniques de transport adaptées sur le simplexe de probabilité. Enfin, nous discutons de la manière dont l'incertitude dans le graphe causal se propage aux cartes de transport et peut conduire à un fairwashing contraire à l'éthique.
 
Inscription avant le 12 mars 2026 : Inscription 


Organisateurs
Marianne Clausel, Emilie Chouzenoux, Emilie Devijver et Clémentine Prieur

Publié le 9 décembre 2025
Mis à jour le 17 février 2026