Federated Learning for Heterogeneous Effect Modification via Coefficient Functions
Data distributed across governance boundaries restricts pooling records, necessitating disclosure-aware approaches that minimize movement. We propose an interpretable, privacy-preserving federated framework for estimating heterogeneous associations under distribution shift. The framework fits a regularized, coefficient-modulating model where predictor effects depend on context variables. This identifies how context influences the magnitude and direction of effects, providing a structured representation of effect modification without separate models for each partition. We evaluate the approach in a simulated federated setting and apply it to a national survey-based mental health dataset. Results show the proposed workflow recovers interpretable heterogeneous effects with competitive performance while reducing person-level data sharing. This provides a scalable option for multi-site modeling where both interpretability and data privacy are paramount.
Apprentissage fédéré pour la modification d'effets hétérogène via des fonctions de coefficient
Les données réparties au-delà des frontières administratives limitent la mise en commun des renseignements, ce qui nécessite des approches tenant compte de la divulgation et minimisant les mouvements. Nous proposons un cadre fédéré interprétable et préservant la confidentialité pour estimer les associations hétérogènes en cas de changement de distribution. Le cadre s'adapte à un modèle régularisé à modulation de coefficients où les effets prédictifs dépendent des variables contextuelles. Cela permet d'identifier comment le contexte influence l'ampleur et la direction des effets, fournissant une représentation structurée de la modification des effets sans modèles distincts pour chaque partition. Nous évaluons cette approche dans un cadre fédéré simulé et l'appliquons à un ensemble de données nationales sur la santé mentale issues d'une enquête. Les résultats montrent que le flux de travail proposé permet de récupérer des effets hétérogènes interprétables avec des performances compétitives tout en réduisant le partage de données au niveau individuel. Cela offre une option extensible pour la modélisation multisite où l'interprétabilité et la confidentialité des données sont primordiales.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English