Aller au contenu principal

Méthodes statistiques et applications 3 
Président: Anand N. Vidyashankar (George Mason University) 
[PDF]

ROJIAR HADDADIAN, University of Manitoba
Estimation fondée sur la simulation dans les modèles de régression avec variable de réponse ordinale et covariables mesurées incorrectement [PDF]
 
Un problème commun dans l'analyse de régression est l'erreur de mesure de certaines covariables. Nous présentons une approche fondée sur la simulation pour l'inférence dans le modèle logit cumulatif pour des variables explicatives ordinales et des covariables mesurées incorrectement. Nous proposons une approche fondée sur la simulation pour surmonter la difficulté de calcul de la minimisation d'une fonction objective qui inclut des intégrales multiples et ainsi obtenir des estimateurs pour les paramètres inconnus. Cette méthode ne nécessite pas d'hypothèses paramétriques sur les distributions des covariables non observées et sur les composantes d'erreur. La cohérence et la normalité asymptotique de l'estimateur proposé sont dérivées sous certaines conditions de régularité. Enfin, la méthodologie est illustrée à l'aide d'études de simulation. 
 
REN MINGCHEN, University of Calgary
Estimation de vraisemblance de la distribution de copules gaussiennes pour des données mixtes au moyen de l'algorithme EM de Monte-Carlo par expansion de paramètres  [PDF]
 
J'utilise la distribution des copules gaussiennes pour construire une distribution conjointe pour des variables mixtes, où j'adopte une description des variables binaires par des variables latentes. Le modèle généralise le modèle continu regroupé, le modèle probit multivarié pour les données binaires ainsi que son extension, le modèle continu regroupé conditionnel, au cas de données mixtes. J'ai utilisé l'algorithme EM avec expansion de paramètres pour estimer les paramètres et effectué une étude de simulation pour étudier les propriétés de l'échantillon de taille finie des estimations. Ceci est un travail conjoint avec A. R. de Leon et Y. Yan. 
 
BOUCHRA NASRI, INRS-ETE
Inférence pour un modèle de régression sur les quantiles basé sur des copules  [PDF]
 
Nous présentons une nouvelle approche pour la modélisation par régression non-linéaire des quantiles, basée sur la fonction de copules. L'idée principale derrière cette approche est de décrire le quantile conditionnel grâce au lien existant entre la loi de la variable d'intérêt conditionnelle à la covariable, la fonction de copules et la distribution marginale. L'estimation du quantile utilise l'estimation des paramètres de la fonction de copules et des distributions marginales. Nous proposons des estimateurs paramétriques et semi-paramétriques des fonctions de quantiles et établissons leur normalité asymptotique. Les résultats de simulations montrent l'efficacité des estimateurs proposés. 
 
MONSUR CHOWDHURY, University of Manitoba
Conceptions optimales pour l'estimation du maximum de vraisemblance  [PDF]
 
Plusieurs problèmes en statistique exigent le calcul d'une ou plusieurs distributions de probabilité optimisante. Nous considérons un tel problème dans lequel nous déterminons les estimations du maximum de vraisemblance des probabilités de cellule sous l'hypothèse d'homogénéité marginale dans les tableaux de contingence carrés. Il s'agit d'un problème de maximisation sous réserve de satisfaire à plusieurs contraintes. Nous formulons d'abord la fonction lagrangienne puis transformons le problème en celui de la maximisation simultanée de certaines fonctions de probabilités de cellules. Enfin, nous appliquons les méthodologies à certains jeux de données réelles. Les méthodes sont assez flexibles et pourraient être appliquées à une grande classe de problèmes d'optimisation. 
 
MAYSUM PANJU, University of Waterloo
Modélisation de sujet dans le traitement du langage naturel  [PDF]
 
En général, les documents écrits en langage naturel ne sont pas seulement des séquences structurées de mots choisis au hasard. La distribution sous-jacente qui détermine quels mots peuvent être trouvés dans un document donné dépend de certains facteurs latents décrivant le domaine principal du document, que l'on peut appeler « sujets ». Grâce à des méthodes statistiques, ces sujets cachés peuvent être découverts et identifiés en fonction des mots qui sont observés dans divers documents. Dans cet exposé, nous explorerons une vue d'ensemble de haut niveau de certaines de ces méthodes, qui permettent à des machines d'inférer les sujets et concepts centraux formant le corps d'un texte. 
 
MAMADOU YAUCK, Laval University
Prédiction des tailles de populations dans les modèles de capture-recapture pour population ouverte  [PDF]
 
Les modèles de capture-recapture sont utilisés pour estimer les paramètres démographiques de populations animales. Plusieurs approches sont disponibles pour les populations ouvertes, par exemple le modèle de Jolly et Seber (1963) et le design robuste de Kendall, Pollock et Brownie (1995). Cet exposé porte sur l'estimation des tailles de populations, considérée comme un problème de prédiction. Nous nous intéressons au cas du design robuste et proposons un prédicteur, meilleur que les estimateurs de Kendall et Pollock et de Rivest et Daigle (2004). Nous présentons ensuite une version empirique du nouveau prédicteur, et traitons enfin de l'estimation de l'erreur de prédiction.