Modèles de prédiction et méthodes d'enquête


Modèles de prédiction et méthodes d'enquête
Président: Christian Léger (Université de Montréal)
[PDF]

CHRISTOPHER VAN BOMMEL, St. Francis Xavier University
Keeping Pace : Activité physique et apport alimentaire des étudiants de Nouvelle-Écosse  [PDF]

Keeping Pace est une étude réalisée en 2009 sur l'activité physique et l'apport alimentaire des étudiants de 3e, 7e et 11e année de Nouvelle-Écosse. Les objectifs de ce projet consistent à déterminer le niveau d'activité physique et l'apport alimentaire habituel de ces jeunes garçons et filles, ainsi que les facteurs qui influencent ces variables. Dans cet exposé, je discute la méthode de sélection des échantillons utilisée, qui comporte une stratification et un échantillonnage en grappes stratifié à deux degrés, les méthodes utilisées pour l'analyse des données recueillies ainsi que certains résultats clés.

MOSHE FEDER, University of Southampton, U.K.
Approche par la vraisemblance empirique pour la non-réponse  [PDF]

La non-réponse informative a souvent une incidence sur les enquêtes, ce qui constitue un problème de taille lors de l'ajustement de modèles aux données d'enquête. Les méthodes qui comportent des ajustements par pondération de classes et de la calibration ont été conçues il y a plusieurs années. Récemment, Chang \& Kott (2008) ont proposé des méthodes basées sur des modèles paramétriques pour la probabilité de réponse et les équations de calibrage. Qin et al.~(2002) considèrent une méthode par la vraisemblance empirique pour la non-réponse informative en supposant un modèle pour les probabilités de réponse et la connaissance de la moyenne des covariables dans la population. Dans cette présentation, nous étudions les méthodes par la vraisemblance empirique pour estimer un modèle en tenant compte de la non-réponse et des sondages informatifs, sans faire l'hypothèse d'un modèle paramétrique pour les probabilités de réponse.

ISABEL MOLINA, Universidad Carlos III de Madrid, Spain
Meilleure estimation empirique pour un modèle de régression linéaire avec erreurs emboîtées et transformation logarithmique  [PDF]

Une transformation logarithmique de la réponse est souvent nécessaire pour ajuster des modèles pour des variables socio-économiques. Ceci s'explique par le fait que les variables monétaires comme le revenu sont fortement asymétriques et que cette transformation peut rendre leur distribution approximativement normale. Toutefois, les paramètres d'intérêt typiques sont les moyennes dans les domaines pour les variables non-transformées, qui seront les moyennes de valeurs dont on aura pris l'exponentielle. Pour ces paramètres non-linéaires spécifiques, on obtient une expression analytique exacte pour le meilleur estimateur. Une expression analytique pour l'erreur moyenne au carré du nouveau meilleur prédicteur empirique est aussi obtenue. Celle-ci est correcte au deuxième ordre s'il y a un grand nombre d'aires.

FATEMEH DORRI, University of Waterloo
Adaptation au décalage d'une covariable par apprentissage métrique  [PDF]

Une hypothèse commune à la plupart des modèles de prévision est que les données d'entraînement et les données de test proviennent de la même distribution. Pour plusieurs applications, cette hypothèse peut toutefois être incorrecte. Nous proposons un nouvel algorithme pour faire face à ce problème. La méthode suggérée calcule une transformation qui projette les jeux de données dans un nouvel espace ayant deux propriétés spécifiques. Premièrement, la distribution des jeux de données d'entraînement et de test sont aussi semblables que possible dans ce nouvel espace et, deuxièmement, la dépendance entre les prédicteurs et la variable dépendante est maximisée. Cette méthode peut également réduire la dimensionalité des données tout en conservant ces deux propriétés.

YAN YUAN, University of Alberta
Estimation de l'erreur de prévision lorsque la distribution des covariables est changeante  [PDF]

Quand des modèles statistiques sont utilisés pour prédire les valeurs de variables aléatoires non observées, l'exactitude de la prévision est souvent quantifiée par des fonctions de perte. L'espérance de la perte sur la distribution de covariables constitue l'erreur de prévision. Les estimateurs actuels de l'erreur de prévision supposent que la distribution des covariables reste inchangée dans les nouvelles données par rapport aux données ``d'entraînement'' utilisées pour la spécification du modèle prédictif. Nous relâchons cette condition pour la distribution des covariables et nous proposons un estimateur qui pondère les pertes relatives aux prévisions sur les données d'entraînement pour estimer la perte moyenne sur la distribution des covariables dans les nouvelles données. Nous comparons différentes méthodes pour choisir les poids.