Enhancing Inference for Small Cohorts via Transfer Learning and Weighted Integration of Multiple Datasets
Lung sepsis remains a major clinical concern in the Northeastern U.S., yet patients from this region are underrepresented in national databases such as eICU, limiting reliable inference on key markers including FiO2, creatinine, platelets, and lactate. To address this, we propose transfer learning with weights (TRANSLATE), an adaptive weighting framework for multi-cohort observational data. TRANSLATE learns cohort-specific weights that reflect both cohort prevalence and alignment with a small anchor cohort, enabling data-driven integration across heterogeneous datasets while downweighting non-comparable cohorts. The method generalizes existing weighting approaches, provides theoretical guarantees for improved precision, and supports a broad class of estimands. Simulations and a real-data lung sepsis application demonstrate improved accuracy and robustness for small anchor cohorts.
Améliorer l’inférence pour les petites cohortes grâce à l’apprentissage par transfert et à l’intégration pondérée de plusieurs ensembles de données
La septicémie pulmonaire demeure un enjeu clinique majeur dans le Nord-Est des États-Unis, mais les patients de cette région sont sous-représentés dans les bases de données nationales comme eICU, ce qui limite l'inférence fiable pour des marqueurs clés tels que la FiO2, la créatinine, les plaquettes et le lactate. Pour répondre à ce défi, nous proposons TRANSLATE (transfer learning with weights), un cadre adaptatif de pondération pour l’apprentissage par transfert à partir de données observationnelles multi-cohortes. TRANSLATE retient des poids spécifiques à chaque cohorte qui tiennent compte à la fois de la prévalence et de l’alignement avec une petite cohorte d’ancrage, permettant une intégration fondée sur les données entre ensembles hétérogènes tout en réduisant le poids des cohortes non comparables. Cette méthode généralise les approches de pondération existantes, offre des garanties théoriques de précision améliorée et prend en charge une large classe d’estimands. Des simulations et une application réelle à la septicémie pulmonaire montrent une exactitude et une robustesse accrues pour de petites cohortes d’ancrage.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais