Analyse de données longitudinales

2005

Date Source: 

Marcelle Tremblay, Dafna Kohen, Georgia Roberts, Karla Nobrega, and Patricia Whitridge from Statistics Canada

Organizer: 

Dr. Peggy Ng Atkinson Faculty of Liberal and Professional Studies Associate Professor in Management Science and Applied Statistics York University, Toronto

Vue d’ensemble/résumé :

Cette étude de cas est conçue pour initier les étudiants à l’analyse de données longitudinales à l’aide de différentes approches (mesures répétées, covariables dynamiques sur le plan temporel, courbes de croissance, etc.) et aux différences entre les approches d’estimation basées sur un modèle et celles basées sur le plan d’enquête. Un sous-échantillon du fichier de données synthétique de l’Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est utilisé pour présenter les problèmes liés à l’estimation et au calcul de la variance dans les enquêtes longitudinales. Les questions touchant au comportement et aux soins aux enfants sont importantes pour les Canadiens et Canadiennes; cet ensemble de données a été créé afin de confronter les étudiants à une situation réaliste dans une enquête longitudinale et des les amener à évaluer la meilleure façon d’analyser et de présenter les données. 
 

Cette étude de cas comprend trois sections. L’étudiant peut choisir de travailler à l’une, à plusieurs ou à toutes trois.
 

1. Analyse des résultats dans le temps

  • Estimations basées sur le plan d’enquête: Étudiez la tendance dans le temps des mesures répétées des heures en garderie, de l’anxiété et/ou de l’agression. Prenez note des problèmes tels que les données manquantes (due à l’attrition ou à d’autres mécanismes) et le calcul des estimations de variance dans le cadre du plan d’enquête; comparez les estimations à l’aide d’une approche basée sur un modèle. 

2. Analyse des résultats dans le temps avec covariables 
 

Étudiez la relation dans le temp entre les heures en garderie, l’anxiété et/ou l’agression et l’âge de l’enfant, son sexe, la situation familiale, la situation d’emploi, la province, le milieu urbain ou rural, le nombre de frères et sœurs, la dépression maternelle et le niveau d’éducation de la mère au moment de la première enquête.

  • Modèles à effets fixes : Plusieurs des covariables peuvent être considérées comme des effets fixes. Si l’étudiant choisit de ne modéliser que les effets fixes, il/elle peut comparer les estimations de variance issues des deux approches pour illustrer l’importance du plan d’enquête en ce qui concerne l’estimation de la variance. De plus, l’étudiant pourra étudier les effets de l’attrition sur les estimations.
    • Estimations basées sur un modèle
    • Estimations basées sur le plan d’enquête
  • Modèles à effets variables dans le temps et modèles à effets aléatoires : Puisque la théorie du calcul de variance avec effets variables dans le temps ou aléatoires continue d’être explorée pour ce qui est des estimations basées sur le plan d’enquête, les étudiants qui souhaitent modéliser les covariables variant dans le temps étudieront les estimations basées sur un modèle dans leur analyse. De plus, ils pourront étudier les effets de l’attrition sur les estimations.
    • Estimations basées sur un modèle

3. Courbes de croissance 

Étudiez la relation dans le temp entre les heures en garderie, l’anxiété et/ou l’agression et l’âge de l’enfant, son sexe, la situation familiale, la situation d’emploi, la province, le milieu urbain ou rural, le nombre de frères et sœurs, la dépression maternelle et le niveau d’éducation de la mère au moment de la première enquête à l’aide de modèles de courbes de croissance. Puisque, ici encore, les effets variables et aléatoires sont un domaine de recherche relativement nouveau pour ce qui est de l’estimation basée sur le plan d’enquête, nous limiterons l’analyse des courbes de croissance à l’estimation basée sur un modèle. De plus, l’étudiant pourra étudier les effets de l’attrition sur les estimations.

  • Estimations basées sur un modèle
    • Effets fixes
    • Effets variables dans le temps
    • Effets aléatoires​​

Anxiété et/ou agression

Les comportements antisociaux et violents et leurs associations avec le crime violent sont en hausse et sont de plus en plus rapportés dans les médias. De nombreux chercheurs se sont intéressés aux prédicteurs des comportements antisociaux et agressifs, mais il n’existe que peu d’études sur l’évolution de ces comportements dans le temps. On compte parmi les prédicteurs de ces comportements certains facteurs propres à l’enfant (âge, sexe) et d’autres liés à la situation socio-économique de la famille, telle que la pauvreté. Les troubles du comportement sont plus répandus chez les garçons et ont tendance à augmenter dans le temps. Divers liens ont été établis entre la pauvreté et les problèmes de comportements : par le biais des collectivités dans lesquelles vivent les enfants (Sampson), des comportements punitifs et sévères de leurs parents, ainsi que des problèmes de santé mentale et du stress de ces derniers (Elder, Mcloyd). Les enfants qui vivent dans des familles pauvres et des quartiers pauvres risquent davantage d’être associés à des groupes de pairs au comportement aberrant ou à des bandes de jeunes qui participent à des activités délinquantes.

La plupart des études transversales et longitudinales montrent que le risque de commettre une infraction avec violence est maximal à la mi-adolescence et que la violence adulte est liée à un passé de violence adolescente (Farrington, 1994; Heusman, et al., 1984; Serbin et al., 1991). Les programmes visant à prévenir la violence adolescente et à réinsérer les jeunes présentant des troubles du comportement ciblent souvent les adolescents. Cependant, d’autres études d’enfants d’âge préscolaire ont tendance à montrer qu’à mesure que les enfants vieillissent, ils présentent généralement des comportements physiquement moins violents (Cairns et al., 1989; Choquet, 1996). En d’autres termes, chez la majorité des enfants l’agressivité culmine à l’âge préscolaire (période pendant laquelle la plupart des tout-petits manifestent des comportements agressifs) et baisse avec le temps. Les enfants qui sont physiquement agressifs et qui n’acquièrent pas un comportement approprié risquent de présenter par la suite d’autres troubles comme l’anxiété, des comportements antisociaux et le rejet par les pairs (Tremblay et al., 1992). De plus, le bien-être comportemental et émotionnel des enfants est capital pour leur développement. Ceux qui présentent des troubles du comportement risquent non seulement de s’adonner à des activités criminelles et délinquantes, mais également de ne pas réussir à l’école, d’avoir de mauvaises notes, de participer à des activités criminelles et délinquantes, d’être au chômage et de souffrir de problèmes de santé physique et mentale (Power et al., 1991). Puisqu’il existe différentes théories sur l’évolution des comportements agressifs chez les enfants et les jeunes, nous ne savons pas comment évolue le schéma de ces comportements à mesure que l’enfant grandit. Les comportements agressifs augmentent-ils ou baissent-ils avec l’âge? Quels sont les facteurs (enfant, famille, etc.) qui prévoient un devenir différent dans ces trajectoires? Bien que la fréquence des problèmes émotionnels soit inférieure à celle des problèmes de comportements agressifs, les résultats des études transversales suggèrent que les symptômes augmentent avec l’âge, atteignant un taux maximum chez les garçons de 8 à 11 ans et un taux minimum chez les filles de 4 à 7 ans (Offord & Lipman, 1996). Toutefois, nous en savons moins sur la trajectoire de comportement des enfants qui présentent des comportements anxieux, principalement parce que les problèmes d’anxiété semblent moins fréquents, ne sont pas remarqués par les enseignants et ne sont pas aussi nuisibles pour la société.

Nombre d’heures en garderie

L’un des changements les plus spectaculaires au Canada depuis 30 ans est l’augmentation du nombre de foyers monoparentaux et de couples où les deux conjoints travaillent. Ces changements ont affecté la façon dont les jeunes familles s’occupent de leurs enfants : le nombre de familles nécessitant une garde d’enfants a augmenté de façon dramatique. Des études montrent que des services de garde d’enfants de qualité et adaptés au stade de développement de l’enfant ont un effet positif sur le développement cognitif et comportemental des enfants d’âge préscolaire et scolaire (Burchinal, Lee & Ramey, 1989; Kohen, Hertzman & Willms, 2002; McCartney, 1984; Andersson, 1989; Broberg et al., 1997; Rosenthal & Vandell, 1996). Toutefois, il n’existe que peu de recherche sur les effets à long terme de la garde d’enfants sur le comportement des enfants. Les résultats d’études sur les associations avec les troubles du comportement sont mitigés. Certaines études montrent une augmentation des problèmes de comportement chez les enfants en garderie, tandis que d’autres n’y concluent pas. Il est difficile de déterminer si les enfants qui présentent plus de problèmes de comportement risquent davantage d’être mis en garderie ou si les enfants mis en garderie risquent davantage de présenter des troubles du comportement. De plus, les systèmes de garderie varient avec l’âge des enfants. En général, le nombre d’heures en garderie diminue dans le temps (à mesure que les enfants vieillissent) puisqu’une fois l’éducation formelle entamée, le besoin de services de garderie diminue. Toutefois, des différences peuvent néanmoins exister dans l’utilisation faite des services de garderie. Par exemple, certains enfants ne vont pas à la garderie lorsqu’ils sont tout petits, mais seulement une fois qu’ils sont à l’école (notamment si la mère reprend le travail lorsque les enfants sont en âge scolaire), d’autres ont recours à des soins de garderie jusqu’à l’adolescence, tandis que d’autres encore n’y ont jamais recours. Ces groupes décrivent-ils avec exactitude les trajectoires de services de garderie ou ces trajectoires diffèrent-elles? Les trajectoires sont-elles associées de façon différentielle aux résultats tels que les problèmes de comportement? On compte parmi les prédicteurs de recours aux services de garderie certains facteurs socio-démographiques tels que la situation de famille, le nombre de frères et sœurs, l’éducation et l’emploi de la mère (Kohen, Hertzman & Willms, 2002). Ces facteurs prévoient-ils des trajectoires de recours aux services de garderie différentes?

Instructions à l’intention de l’étudiant — Analyse (MS Word)

 

Research Question: 

Objectifs
 

Pour cette étude de cas, un exemple d’enquête sera utilisé pour initier les étudiants aux nombreuses questions associées à l’analyse de données longitudinales. Par manque d’autres possibilités, les données longitudinales sont souvent analysées à l’aide de méthodes statistiques, comme les tests t, l’analyse de variance et la régression classique des moindres carrés.
 

Questions analytiques
 

Les chercheurs qui étudient le développement de l’enfant s’intéressent souvent à la façon dont les enfants changent en grandissant et aux facteurs qui contribuent à ce changement. À ce jour, ils ont souvent été limités à des données transversales, puisque peu d’entre eux avaient accès à des données longitudinales. Ce n’est que récemment que de plus grands ensembles de données longitudinales sur le développement des enfants et des jeunes sont devenus disponibles, nécessitant l’utilisation de méthodes longitudinales sophistiquées pour analyser le changement dans le temps. Les données longitudinales ont notamment été utilisées pour étudier l’évolution dans le temps des problèmes comportementaux des enfants.

 

Variables: 

Cette étude utilise un petit échantillon du fichier de données synthétique de l’Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) pour présenter les problèmes liés à l’estimation et au calcul de la variance dans les enquêtes longitudinales. Le problème d’analyse de données est à considérer dans le contexte des nombreuses questions touchant au comportement et aux soins aux enfants, questions d’actualité partout au pays.
 

Trois ensembles de données sont disponibles dans le cadre de l’étude de cas ELNEJ de la SSC :
 

1. Fichier primaire

2. Fichier des poids bootstrap longitudinaux du cycle 1

3. Cycle 4 funnel weight bootstrap file

Description détaillée de chacun de ces fichiers (MS Word ).

 

References: 

 

Anderson, T.W. (1958), An Introduction to Multivariate Statistical Analysis, New York: John Wiley & Sons, Inc.
 

Andersson, B. E. 1989. Effects of day care on cognitive and socio-emotional competence of thriteen year old Swedish school children. Child Development, 63, 20-36
 

Andersson, B.E. 1992. Effects of public day-care: A longitudinal study. Child Development, 60(4), 857-66
 

Bijleveld, C. C. J. H., & van der Kamp, T. (1998). Longitudinal data analysis: Designs, models, and methods. Newbury Park: Sage.
 

Brown, C.H. & Liao, J. (1999). Principles for designing randomized preventive trials in mental health: An emerging development epidemiologic perspective. American Journal of Community Psychology, special issue on prevention science, 27, 673 709.
 

Brown, C.H., Indurkhya, A. & Kellam, S.K. (2000). Power calculations for data missing by design: applications to a follow up study of lead exposure and attention. Journal of the American Statistical Association, 95, 383 395.
 

Broberg, A., Wessels, H., Lamb, M.E, Hwang, C. 1997. Effects of day care on the development of cognitive abilities in 8 year olds: A longitudinal study. Developmental Psychology, 33(1), 62-69
 

Burchinal, M., Lee, M.W. & Ramey, C.T. 1989. Type of day care and preschool intellectual development in disadvantaged children. Child Development, 60, 128-37
 

Cairns R, Cairns B, Neckerman H, Ferguson L, Gariepy J. Growth and aggression: 1. Childhood to early adolescence. Developmental Psychology 1989;25:320-30.
 

Choquet M. La violence des jeunes: Donnees epidemiologiques. In Rey C, ed. Les adolescents face a la violence, pp 51-63. Paris: Syros, 1996
 

Collins, L.M. & Sayer, A. (Eds.) (2001). New Methods for the Analysis of Change. Washington, D.C.: APA.
 

Cochran, W.G. and Cox, G.M. (1957), Experimental Designs, Second edition. New York: John Wiley & Sons, Inc.
 

Curran, P.J., & Bollen, K.A. (2001). The best of both worlds: Combining autoregressive and latent curve models. In Collins, L. M. & Sayer, A. G. (Eds.), New Methods for the Analysis of Change (pp. 105 136). Washington, DC: American Psychological Association.
 

Duncan, T. E., Duncan, S. C., Strycker, L. A., Li, F., & Alpert, A. (1999). An Introduction to Latent Variable Growth Curve Modeling: Concepts, Issues, and Applications. Mahwah, NJ: Lawrence Erlbaum Associates.
 

Elder, G.H., Conger, R.D., Foster, E.M. & Ardelt, M. 1992. Families under economic pressure. Journal of Family Issues, 13(1), 5-37
 

Elder, G.H., Nguyen, T.V. & Caspi, A. 1985. Linking family hardship to children’s lives. Child Development 56, 361-75
 

Farrington D. Childhood, adolescent, and adult features of violent males. In Huesmann L, ed. Aggressive behaviour: current perspectives, pp 215-40. New York: Plenum, 1994.
 

Ferrer, E. & McArdle, J.J. (2003). Alternative structural models for multivariate longitudinal data analysis. Structural Equation Modeling, 10, 493 524.
 

Goldstein, H. (1995). Multilevel statistical models. Second edition. London: Edward Arnold.
 

Huesmann L, Eron L, Lefkowitz M, Walder L. Stability of aggression over time and generations. Developmental Psychology 1984;20:1120-34.
 

Jennrich, R.I., & Schluchter, M.D. (1986). Unbalanced repeated measures models with structured covariance matrices. Biometrics, 42, 805 820.
 

Khoo, S.T. & Muthén, B. (2000). Longitudinal data on families: Growth modeling alternatives. In Multivariate Applications in Substance use Research, J. Rose, L. Chassin, C. Presson & J. Sherman (eds.), Hillsdale, N.J.: Erlbaum, pp. 43 78. (#79)
 

Kohen, D.E., Hertzman C., & Willms, D.W. 2002. The importance of quality child care. In J.D. Willms (Ed.) Vulnerable Children, University of Alberta Press, 2002.
 

Laird, N.M., & Ware, J.H. (1982). Random effects models for longitudinal data. Biometrics, 38, 963 974.
 

Lange, N. and Ryan, L. (1989), Asymptotic Normality in Random Effects Models, Annals of Statisics, 17, 624-642
 

Liang, K and Zeger, S (1986) Longitudinal Data Analysis Using Generalized Linear Model, Biometrika, 73, 1, pp 13-22
 

Lindstrom, M.J., & Bates, D.M. (1988). Newton Raphson and EM algorithms for linear mixed effects models for repeated measures data. Journal of the American Statistical Association, 83, 1014 1022.
 

Littell, R., Milliken, G.A., Stroup, W.W., & Wolfinger, R.D. (1996). SAS system for mixed models. Cary NC: SAS Institute.
 

Lohr, S.L. (1999) Sampling: Design and Analysis, Pacific Grove; CA: Duxbury
 

MacCallum, R.C., Kim, C., Malarkey, W.B., Kiecolt-Glaser, J.K. (1997). Studying multivariate change using multilevel models and latent curve models. Mulitvariate Behavioral Research, 32(3), 215-253
 

McArdle, J.J. & Epstein, D. (1987). Latent growth curves within developmental structural equation models. Child Development, 58, 110 133.
 

McArdle, J.J. & Hamagami, F. (2001). Latent difference score structural models for linear dynamic analyses with incomplete longitudinal data. In Collins, L. M. & Sayer, A. G. (Eds.), New Methods for the Analysis of Change (pp. 137 175). Washington, DC: American Psychological Association.
 

McCartney, K. 1984. Effect of quality of day care environment on chidlren’s language development. Developmental Psychology, 20(2), 244-60
 

Miyazaki, Y. & Raudenbush, S.W. (2000). A test for linkage of multiple cohorts from an accelerated longitudinal design. Psychological Methods, 5, 44 63.
 

Meredith, W. & Tisak, J. (1990). Latent curve analysis. Psychometrika, 55, 107 122.
 

Moerbeek, M., Breukelen, G.J.P. & Berger, M.P.F. (2000). Design issues for experiments in multilevel populations. Journal of Educational and Behavioral Statistics, 25, 271 284.
 

Muthén, B. (1997). Latent variable modeling with longitudinal and multilevel data. In A. Raftery (ed), Sociological Methodology (pp. 453 480). Boston: Blackwell Publishers.
 

Muthén, B. & Curran, P. (1997). General longitudinal modeling of individual differences in experimental designs: A latent variable framework for analysis and power estimation. Psychological Methods, 2, 371 402.
 

Nagin, D.S. & Tremblay, R.E. (2001). Parental and early childhood predictors of persistent physical aggression in boys from Kindergarten to high school. Arch Gen Psychiatry, 58, 389-394
 

Nagin, D.S., Pagani, L, Tremblay, R.E. & Vitaro, F. (2003). Life course turning points : The effect of grade retention on physical aggression. Development and Psychopathology, 15, 343-361.
 

Nagin, D.S., & Tremblay, R.E. (1999). Trajectories of boys’ physical aggression, opporisiton, and hyperactivity on the path to physically violent and non-violent juvenile delinquency. Child Development, 70(5), 1181-1196
 

Power C, Manor O, Fox A. Health and class: the early years. London: Chapman and Hall, 1991.
 

Rao, C.R. (1958). Some statistical models for comparison of growth curves. Biometrics, 14, 1 17.
 

Ratkowsky, D. (1990), “Handbook of Nonlinear Regression Models,” Marcel Dekker: New York and Basel.
 

Raudenbush, S.W. (2001). Comparing personal trajectories and drawing causal inferences from longitudinal data. Annual Review of Psychology, 52, 501-25
 

Raudenbush, S.W. & Bryk, A.S. (2002). Hierarchical linear models: Applications and data analysis methods. Second edition. Newbury Park, CA: Sage Publications.
 

Raudenbush, S.W. (1997). Statistical analysis and optimal design for cluster randomized trials. Psychological Methods, 2, 173 185.
 

Raudenbush, S.W. & Liu, X. (2000). Statistical power and optimal design for multisite randomized trials. Psychological Methods, 5, 199 213.
 

Rosenthal, R. & Vandell, D. (1996). Quality of care at school-aged child care programs: Regulatable features, observed experiences, child perspectives and parent perspectives. Child Development, 67, 2434-45.
 

Satorra, A. & Saris, W. (1985). Power of the likelihood ratio test in covariance structure analysis. Psychometrika, 51, 83 90.
 

Serbin L, Schwartzman A, Moskowitz D, Ledingham J. Aggressive, withdrawn and aggressive-withdrawn children in adolescence: into the next generation. In Pepler D, Rubin K, eds. The development and treatment of childhood aggression, pp 51-70. Hillsdale: Erlbaum, 1991
 

Singer, J.D. (1998). Using SAS PROC MIXED to fit multilevel models, hierarchical models, and individual growth models. Journal of Educational and Behavioral Statistics, 23, 323 355.
 

Singer, J.D. & Willett, J.B. (2003). Applied longitudinal data analysis. Modeling change and event occurrence. New York, NY: Oxford University Press.
 

Snijders, T. & Bosker, R. (1999). Multilevel analysis. An introduction to basic and advanced multilevel modeling. Thousand Oakes, CA: Sage Publications.
 

Tremblay RE, Masse B, Perron D, Leblanc M. Disruptive behaviour, poor school achievement, delinquent behaviour, and delinquent personality: longitudinal analyses. Journal of Consulting & Clinical Psychology 1992;60:64-72.
 

Tucker, L.R. (1958). Determination of parameters of a functional relation by factor analysis. Psychometrika, 23, 19 23.