Skip to main content
Variable Selection and Estimation in the Presence of Measurement Errors and Missing Data
Thanks to technological advances, high-dimensional data are becoming increasingly common. These data represent an opportunity to improve our decision-making, particularly by exploiting them appropriately with supervised methods. However, in addition to computational challenges, high-dimensional data often contain measurement errors and missing data that need to be addressed to reduce inherent biases and improve accuracy. However, standard statistical methods and learning algorithms do not take these limitations into account, hence the need to develop new methods capable of addressing these high-dimensional challenges.
In this research, we propose an adaptive method of Discom, namely AdaDiscom, to simultaneously account for measurement errors and missing data as well as the multi-modalities' heterogeneity.
In addition to its good asymptotic properties, we show that AdaDiscom outperforms existing methods through exhaustive simulation scenarios. We also apply AdaDiscom to the multimodal
Sélection et estimation de variables en présence d'erreurs de mesure et de données manquantes
Grâce aux progrès technologiques, les données en grande dimension deviennent de plus en plus fréquentes. Ces données représentent une opportunité pour améliorer nos prises de décisions, notamment si nous les exploitons adéquatement avec des méthodes supervisées. Cependant, en plus des défis computationnels, ces données comportent souvent des erreurs de mesure et des données manquantes dont il est important de tenir compte pour réduire les biais inhérents et améliorer la précision. Toutefois, les méthodes statistiques et algorithmes d’apprentissage standard ne prennent pas en compte ces limites, d’où la nécessité de développer de nouvelles méthodes capables de prendre en compte ces défis en grande dimension.
Dans ce travail de recherche, nous proposons une méthode adaptive nommée AdaDiscom qui améliore la méthode Discom pour tenir compte simultanément des erreurs de mesure et des données manquantes ainsi que de l’hétérogénéité des modalités.
En plus de ses bonnes propriétés asymptotiques, nous montrons qu’AdaDiscom surpasse les méthodes existantes à travers une simulation exhaustive de scénarios. Nous appliquons également AdaDiscom sur les données multimodales de l’ADNI (Alzheimer’s Disease Neuroimaging Initiative) pour démontrer son bénéfice dans le cas réel.
Date and Time
-
Additional Authors and Speakers (not including you)
Moreau Claudia
Université du Québec à Chicoutimi
Girard Simon
Université du Québec à Chicoutimi
Barry Amadou
Institut National de la Recherche Scientifique

Speaker

Edit Name Primary Affiliation
Maimouna Balde INRS - Institut Armand-Frappier