Missing Data Methods for Discriminant Analysis for Incomplete Multivariate Longitudinal Data
Longitudinal classification models have been developed for multivariate longitudinal data, yet little is known about their accuracy under incomplete data. Using Monte Carlo simulations, we evaluated the classification accuracy of longitudinal discriminant analysis based on multivariate GLMM, across missing data mechanisms (MCAR, MAR, MNAR), missingness proportions, patterns (monotone, non-monotone), and outcome types (continuous, count, mixed). Available-case analysis showed decreasing classification accuracy as missingness increased, with the largest reductions under MNAR. In contrast, single and multiple imputation approaches performed best under MCAR and MAR, whereas joint modeling approaches were optimal under MNAR. Recommendations for selecting between imputation and joint modeling strategies to improve classification accuracy in incomplete multivariate longitudinal data will be discussed.
Méthodes de traitement des données manquantes pour l'analyse discriminante de données longitudinales multivariées incomplètes
Des modèles de classification longitudinale existent pour les données longitudinales multivariées, mais leur précision en cas de données incomplètes reste mal connue. À l'aide de simulations Monte Carlo, nous avons évalué la précision de la classification par analyse discriminante longitudinale basée sur un GLMM multivarié, pour divers mécanismes de données manquantes (MCAR, MAR, MNAR), proportions de données manquantes, modèles (monotones, non monotones) et types de résultats (continus, dénombrables, mixtes). L'analyse des cas disponibles montre une diminution de la précision de la classification à mesure que les données manquantes augmentent, les réductions les plus importantes étant observées dans le cas MNAR. En revanche, les approches d'imputation unique et multiple donnent les meilleurs résultats dans les cas MCAR et MAR, tandis que les approches de modélisation conjointe sont optimales pour le cas MNAR. Nous discuterons de recommandations pour choisir entre les stratégies d'imputation et de modélisation conjointe afin d'améliorer la précision de la classification pour les données longitudinales multivariées incomplètes.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais