2008 SSC Annual Meeting

Stratégies de modélisation en régression


Le dimanche 25 mai 2008
9 h à 16 h


Par Frank Harrell
Vanderbilt University


La première partie de l’atelier présente les éléments suivants de la modélisation multivariée de la prédiction pour une variable de réponse simple : utilisation des fonctions splines de régression pour relâcher les hypothèses de linéarité, périls de la sélection des variables et surajustement, nombre de degrés de liberté, rétrécissement, imputation des valeurs manquantes, réduction des données et surfaces d’interaction. On décrira par la suite une stratégie de modélisation générale. Suivra ensuite la présentation de méthodes pour comprendre graphiquement les modèles (par exemple, en utilisant des nomogrammes) et l’utilisation du rééchantillonnage pour estimer la performance d’un modèle sur de nouvelles données. Puis le module Design du logiciel R qui est disponible gratuitement sera passé en revue. Design facilite la plupart des étapes du processus de modélisation. En outre, deux des trois études de cas suivantes seront présentées : une exploration interactive du statut de l’état de survie des passagers du Titanic, une étude de cas interactive dans l’élaboration d’un modèle du temps de survie pour les patients en phase critique ainsi qu’une étude de cas sur la régression de Cox.


La consultation préalable des références suivantes pourrait être utile aux participants.

  1. F. E. Harrell, K. L. Lee, and D. B. Mark. Multivariable prognostic models: Issues in developing models, evaluating assumptions and adequacy, and measuring and reducing errors. Statistics in Medicine, 15:361—387, 1996.
  2. F. E. Harrell, P. A. Margolis, S. Gove, K. E. Mason, E. K. Mulholland, D. Lehmann, L. Muhe, S. Gatchalian, and H. F. Eichenwald. Development of a clinical prediction model for an ordinal outcome: The World Health Organization ARI Multicentre Study of clinical signs and etiologic agents of pneumonia, sepsis, and meningitis in young infants. Statistics in Medicine, 17:909—944, 1998.
  3. Spanos, F. E. Harrell, and D. T. Durack. Differential diagnosis of acute meningitis: An analysis of the predictive value of initial observations. Journal of the American Medical Association, 262:2700—2707, 1989.


L’atelier se déroulera en anglais.


Sur l’animateur :


M. Frank Harrel est professeur au département de biostatistique à l’université Vanderbilt et détenteur d’une chaire de recherche. Il s’intéresse principalement aux études sur les réponses des patients en général et plus particulièrement au développement de modèles de pronostics, et de diagnostics fiables et aussi de modèles pour d’autres types de réponses du patient. Son ouvrage intitulé Regression Modeling Strategies with Applications to Linear Models, Logistic Regression, and Survival Analysis (2001, Springer-Verlag) fait état de la théorie, d’exemples, et d’études de cas détaillées qui démontrent l’utilisation d’un nombre important d’outils actuels de modélisation statistique.