GeneClinTransform: Pretraining a Genomic Foundation Model for Complex Disease Risk Prediction
Accurate disease risk prediction enables early identification of high-risk individuals before symptoms appear. However, traditional models struggle with generalizability, overlook genetic interactions, and rely on static data, limiting their effectiveness in dynamic contexts.
This project develops a multimodal genomic foundation model using UK Biobank data to integrate genetic interactions and improve prediction accuracy. To assess generalizability, I will evaluate the model on datasets from the Canadian Longitudinal Study on Aging and All of Us. Additionally, I will analyze longitudinal health data to enhance predictions of dynamic disease progression. Conformal prediction will be employed to ensure interpretability and fairness by generating well-calibrated risk intervals.
By integrating AI with large-scale genomic and longitudinal health data, this approach aims to transform disease risk prediction, enabling personalized, equitable, and effective healthcare interventions.
This project develops a multimodal genomic foundation model using UK Biobank data to integrate genetic interactions and improve prediction accuracy. To assess generalizability, I will evaluate the model on datasets from the Canadian Longitudinal Study on Aging and All of Us. Additionally, I will analyze longitudinal health data to enhance predictions of dynamic disease progression. Conformal prediction will be employed to ensure interpretability and fairness by generating well-calibrated risk intervals.
By integrating AI with large-scale genomic and longitudinal health data, this approach aims to transform disease risk prediction, enabling personalized, equitable, and effective healthcare interventions.
GeneClinTransform : préentraînement d’un modèle génomique de base pour la prédiction de risques de maladies complexes
Une prédiction précise du risque de maladie permet d’identifier rapidement les personnes à haut risque avant l’apparition des symptômes. Cependant, les modèles traditionnels peinent à se généraliser, négligent les interactions génétiques et s’appuient sur des données statiques, ce qui limite leur efficacité dans des contextes dynamiques. Ce projet développe un modèle de base génomique multimodal utilisant les données de la UK Biobank afin d’intégrer les interactions génétiques et d’améliorer la précision de la prédiction. Pour évaluer la généralisabilité, j’évaluerai le modèle sur des ensembles de données provenant de l’Étude longitudinale canadienne sur le vieillissement et du programme de recherche All of Us. En outre, j’analyserai des données longitudinales sur la santé afin d’améliorer les prédictions de la progression dynamique des maladies. La prédiction conforme sera utilisée pour garantir l’interprétation et l’équité en générant des intervalles de risque bien calibrés. En intégrant l’IA aux données génomiques et longitudinales de santé à grande échelle, cette approche vise à transformer la prédiction des risques de maladie, permettant des interventions de santé personnalisées, équitables et efficaces.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais