Development and Application of Machine Learning Ensemble Algorithms to Genome-Wide Association Studies
Genome-wide association studies (GWASs) explore the association between millions of genotypic data points and phenotypic outcomes. The high dimensionality of genotypic information and its complex correlation structure challenge traditional statistical methods. The development of machine learning methods provides ways to design more effective tools to extract information from data. Specifically, ensemble learning offers a flexible way to combine information from various models to improve outcome prediction and feature selection.
In this talk, we showcase the development of various ensemble learning algorithms for specific GWAS data with different purposes, including EPPS and BLESS for feature identification, and TSMA for prediction using imbalanced data.
In this talk, we showcase the development of various ensemble learning algorithms for specific GWAS data with different purposes, including EPPS and BLESS for feature identification, and TSMA for prediction using imbalanced data.
Développement et application d'algorithmes d'ensemble d'apprentissages automatiques pour les études d'association à l'échelle du génome
Les études d'association à l'échelle du génome (GWAS) explorent l'association entre des millions de points de données génotypiques et des résultats phénotypiques. La grande dimensionnalité des informations génotypiques et leur structure de corrélation complexe posent un défi aux méthodes statistiques traditionnelles. Le développement de méthodes d'apprentissage automatique permet de concevoir des outils plus efficaces pour extraire des informations des données. En particulier, l'apprentissage d'ensemble offre un moyen flexible de combiner les informations provenant de différents modèles afin d'améliorer la prédiction des résultats et la sélection des caractéristiques. Dans cet exposé, nous présentons le développement de divers algorithmes d'apprentissage ensembliste pour des données GWAS déterminées ayant des objectifs différents, notamment EPPS et BLESS pour l'identification des caractéristiques, et TSMA pour la prédiction à l'aide de données déséquilibrées.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English