Écart salarial entre les jeunes hommes et femmes

2011

Date Source: 

the Data Liberation Initiative (DLI)

Organizer: 

Lenka Mach or Karla Fox of Statistics Canada

 

Remerciements
 

 

Ces données sont fournies via l’Initiative de démocratisation des données (IDD), qui permet aux professeurs et étudiants des établissements postsecondaires participants à accéder à de nombreux fichiers de microdonnées à grande diffusion de Statistique Canada.
 

Pour plus d’informations sur l’IDD, veuillez consulter : 
http://www.statcan.gc.ca/dli-ild/dli-idd-fra.htm.
 

Pour toute question, veuillez contacter Lenka Mach ou Karla Fox chez Statistique Canada.

Contexte

Les écarts d’emploi et de salaire entre les hommes et les femmes ont été étudiés par de nombreux économistes du travail canadiens, par exemple Christofides et Swidinsky (1994), Baker et al. (1995), Drolet (2001). Frenette et Coulombe (2007) examinent l’écart entre les sexes sur le marché du travail pour les jeunes de 25 à 29 ans sur la base des données du formulaire détaillé du Recensement canadien des années 1981, 1991 et 2001. Le principal objectif de leur étude est d’évaluer si le niveau d’instruction, en hausse chez les jeunes femmes, a un quelconque impact sur l’écart entre les sexes en ce qui concerne l’emploi à plein temps et le revenu. Drolet (2011) réexamine les différences de salaire entre les hommes et les femmes en comparant les salaires horaires des travailleurs à plein temps de 1988 à 2008.


L’analyse de l’écart entre les sexes commence généralement par la production d’une estimation des statistiques descriptives pour des domaines spécifiques, suivie d’un test d’hypothèses concernant ces statistiques. Par exemple, Frenette et Coulombe (2007) estiment les taux d’emploi à l’aide d’un échantillon de personnes actives de 25 à 29 ans (hommes et femmes), puis ils examinent la différence entre ces derniers. Drolet (2001, Tableau 2) estime le revenu annuel pour les travailleurs ayant travaillé des années complètes à temps plein dans différents domaines, tels que définis par l’âge, l’éducation, etc., puis examine le ratio du revenu femme/homme. Étant donné que cette comparaison ne garantit pas une comparaison de quantités égales de travail, Drolet (2011) estime le salarie horaire pour les hommes et les femmes à temps plein, puis analyse le ratio du salaire horaire femme/homme et l’écart. Alors que ces auteurs comparent des estimations ponctuelles de manière heuristique, un statisticien pourrait aussi souhaiter tester des hypothèses pour déterminer si les paramètres de population sont différents entre les deux sexes. Luong (2010) utilise un échantillon d’individus âgés de 20 à 45 ans qui ne poursuivent pas d’études, tiré des données transversales de l’EDTR de 2007, et teste l’hypothèse de savoir si le statut d’emploi d’un groupe d’intérêt est différent du statut d’emploi du groupe de référence.


Si des données sont disponibles sur les facteurs individuels qui influencent les résultats sur le marché du travail, il peut être très utile de caler un modèle de régression pour analyser l’écart entre les sexes en matière d’emploi et de revenu. Ces facteurs peuvent aider à expliquer les différences observées dans les résultats. Ainsi, Frenette et Coulombe (2007) utilisent des modèles logit et probit pour prédire la probabilité de l’emploi à plein temps et la régression linéaire pour modéliser le logarithme du revenu. Dans ces modèles, ils utilisent des variables explicatives comme l’éducation, l’état matrimonial, le domicile (Frenette et Coulombe, 2007, Table 1). Drolet (2001, Annexe 1) utilise aussi la régression pour modéliser le logarithme du salaire horaire à l’aide des données de l’EDTR de 1997, avec une mesure de l’expérience sur le marché du travail, l’équivalent d’années complètes de travail à temps plein et autres caractéristiques importantes pour déterminer les salaires.


Lorsque l’objectif est d’identifier les causes sous-jacentes des écarts entre les sexes sur le marché du travail, les économistes du travail utilisent souvent des procédures de décomposition. Ces méthodes, attribuées à Blinder (1973) et Oaxaca (1973), divisent l’écart en deux éléments, l’un qui s’explique par les différences entre les caractéristiques qui déterminent les salaires chez les femmes et les hommes (élément expliqué) et l’autre qui est dû à divers effets de ces caractéristiques (élément inexpliqué). Ce dernier élément est souvent utilisé comme une mesure de discrimination, mais il faut noter qu’il inclut les effets de différences entre les groupes dans des variables explicatives non observées. Dans le plus simple cas, la décomposition est de la forme suivante:



La procédure de Blinder-Oaxaca et autres méthodes de décomposition sont discutées par Frenette et Coulombe (2007) et Drolet (2011). De plus, vous trouverez des procédures SAS et Stata à l’adresse suivante : http://people.ucsc.edu/~rfairlie/decomposition/


La plupart des études mentionnées ci-dessus utilisent des données sur plusieurs périodes de références et examinent l’évolution dans le temps de l’écart entre les sexes. D’autres études examinent cet écart pour une seule période de référence : Christofides et Swidinsky (1994) utilisent l’Enquête sur l’activité du marché de 1989 et Drolet (2001) utilise les données de l’EDTR de 1997.


Lorsque les chercheurs utilisent des données recueillies dans le cadre d’une enquête complexe, ils doivent déterminer s’il leur faut utiliser une approche fondée sur le plan ou fondée sur le modèle pour leur analyse. Leur choix dépendra de l’objectif de leur analyse et de facteurs tels que le caractère informatif ou ignorable du plan.


Vous trouverez une description des approches fondées sur le plan et fondées sur le modèle ici .


Données


Le fichier de microdonnées à grande diffusion (FMGD) de l’Enquête sur la dynamique du travail et du revenu (EDTR) sera utilisé aux fins de cette étude. Des fichiers FMGD transversaux de l’EDTR sont disponibles pour les années de référence 1996-2008 via l’Initiative de démocratisation des données (IDD). L’EDTR collecte des données concernant aussi bien les familles que les individus, si bien que quatre fichiers FMGD EDTR sont créés pour chaque année de référence. Le fichier personne sera utilisé dans cette étude.


Les métadonnées, qui incluent un Guide de l’utilisateur, un dictionnaire des données et les distributions unidimensionnelles pour les variables collectées, concernant tous les fichiers EDTR de la collection IDD sont disponibles ici : http://www.statcan.gc.ca/dli-ild/data-donnees/ftp/slid-edtr-fra.htm.


Plan de sondage de l’Enquête sur la dynamique du travail et du revenu (EDTR)


Les échantillons pour l’EDTR sont choisis à partir de l’Enquête sur la population active (EPA) mensuelle et, par conséquent, hérite du plan de sondage de l’EPA. L’échantillon pour l’EPA est fondé sur un plan de sondage stratifié à deux degrés qui utilise de l’échantillonnage probabiliste. Chaque province est divisée en grandes strates géographiques (régions économiques) pour lesquelles des estimations fiables sont requises. Chaque strate est formée de plus petites régions géographiques nommées grappes ou unités primaires d'échantillonnage (UPE). Au premier degré d’échantillonnage, un échantillon de ces UPE est sélectionné au sein de chaque strate, et dans chaque UPE, on établit la liste de tous les logements. Ensuite, lors du deuxième degré d’échantillonnage, un échantillon de logements est sélectionné dans chaque UPE sélectionnée. Les résidents des logements sélectionnés forment l’échantillon de l’EPA. L’échantillon transversal de l’EDTR est composé d’approximativement 34 000 ménages qui ont été supprimés de l’échantillon de l’EPA quelques années auparavant. 


Utiliser le fichier de microdonnées à grande diffusion pour effectuer des analyses fondées sur le plan de sondage


Le poids de sondage est fourni par le fichier de microdonnées à grande diffusion (FMGD) afin d’être utilisé pour la production des estimations ponctuelles convergentes par rapport au plan. Voir les sections 4 et 5 du guide de l’utilisateur (Guide de l’utilisateur du fichier transversal de microdonnées à grande diffusion : Enquête sur la dynamique du travail et du revenu) pour consulter les lignes directrices afférentes à la production d’estimations ponctuelles fiables.


Afin d’estimer  , de l’information sur le plan de sondage supplémentaire est nécessaire (p. ex. identificateurs de strates et de grappes), mais elle n’est pas disponible en ce moment sur le FMGD de l’EDTR pour des raisons de confidentialité. Face à cette situation, les analystes peuvent utiliser les effets de plan de sondage, s’ils sont disponibles, pour faire l’approximation de  par .

 

Research Question: 


Les étudiants pourront se pencher sur les questions suivantes :
 

1. Y a-t-il une différence entre l’emploi et le revenu des jeunes hommes et femmes (âgés de 25 à 34 ans)?
    a. Cette conclusion varie-t-elle selon qu’on adopte une approche fondée sur le plan ou sur le modèle?
    b. Si vous supposez l’existence de différents effets de plan, que ce soit 2 ou 20, vos résultats changent-ils?
    c. Le plan est-il ignorable?

2. En cas de différences, celles-ci peuvent-elles être attribuées aux variables explicatives?
    a. Quels sont les facteurs les plus importants?
    b. La pondération modifie-t-elle l’inférence?

3. Peut-on décomposer l’écart?
    a. Quelles en sont les portions expliquées et non expliquées?

 

Variables: 

À l’aide du fichier de microdonnées à grande diffusion (FMGD) transversal de l’Enquête sur la dynamique du travail et du revenu (EDTR), analysez l’écart salarial et de revenu entre les jeunes hommes et femmes (âgés de 25 à 34 ans) qui vivent dans les dix provinces canadiennes. Apprenez à manipuler l’approche fondée sur le plan et examinez les différences entre celle-ci et l’approche fondée sur le modèle.

 

Data Access: 


Les étudiants peuvent accéder aux fichiers FMGD de l’EDTR via la personne-ressource IDD de leur université.
 

Pour identifier cette personne-ressource dans votre établissement, consultez http://www.statcan.gc.ca/dli-ild/contact-fra.htm.
 

Si votre université ne participe pas à l’IDD, veuillez contacter Lenka Mach qui vous aidera à accéder aux données.
 

Data Files: 

References: 

 

Baker, M., Benjamin, D., Desaulniers, A. and Grant, M. (1995). The distribution of the male/female earnings differential, 1970-1990. Canadian Journal of Economics. 28, 3: 479–501.
 

Barnard, G. A. (1971). Discussion of the paper by Professor Godambe and Dr. Thompson. (Bayes, Fiducial and Frequency Aspects of Regression Analysis in Survey-sampling.) Journal of the Royal Statistical Society, Series B, 33, 3, 361-390.
 

Binder, D.A. and Roberts, G.R. (2001). Can Informative Designs be Ignorable? Survey Research Methods Section Newsletter, Issue 12. American Statistical Association.
 

Binder, D.A. and Roberts, G.R. (2003), Design-based and Model-based Methods for Estimating Model Parameters. In Analysis of Survey Data (R.L. Chambers and C.J. Skinner, eds.), pp. 29-48, Chichester: Wiley.
 

Binder, D.A., Kovacevic, M.S. and Roberts, G.R. (2005). How important is the informativeness of the sample design? Proceedings of the Survey Methods Section, Annual Meeting of the Statistical Society of Canada in Saskatoon.
http://www.ssc.ca/survey/documents/SSC2005_D_Binder.pdf (accessed December 22, 2010).
 

Blinder, A.S. (1973). Wage discrimination: Reduced form and structural estimates. Journal of Human Resources. 8, 4: 436–455.
 

Christofides, L.N. and Swidinsky. R. (1994). Wage determination by gender and visible minority status: Evidence from the 1989 LMAS. Canadian Public Policy. 21, 1: 34–51.
 

Drolet, M. (2001). The Persistent Gap: New Evidence on the Canadian Gender Wage Gap. Statistics Canada Catalogue no. 11F0019MPE No. 157. Ottawa, Ontario. Analytical Studies Branch Research Paper Series. 
http://www.statcan.gc.ca/pub/11f0019m/11f0019m2001157-eng.pdf (accessed December 30, 2010).
 

Drolet, M. (2011). Why has the gender wage gap narrowed? Perspectives on Labour and Income. Statistics Canada Catalogue no. 75-001-X. 
http://www.statcan.gc.ca/pub/75-001-x/2011001/article/11394-eng.htm (accessed December 30, 2010).
 

Frenette, M. and Coulombe, S. (2007). Has Higher Education among Young Women Substantially Reduced the Gender Gap in Employment and Earnings? Statistics Canada Catalogue no. 11F0019MIE - No.301. Ottawa, Ontario. Analytical Studies Branch Research Paper Series. 
http://www.statcan.gc.ca/pub/11f0019m/11f0019m2007301-eng.htm (accessed December 10, 2010).
 

Heeringa, S.G., West, B.T. and Berglund, P.A. (2010). Applied Survey Data Analysis. Chapman & Hall/CRC.
 

Kish, L. (1965). Survey Sampling. New York: John Wiley.
 

Kish, L. (1995). Methods for Design Effects. Journal of Official Statistics, 11, 55-77.
 

Korn, E.L., and Graubard, B.I. (1990). Simultaneous testing of regression coefficients with complex survey data: Use of Bonferroni t-statistics. American Statistician, 44, 270-276.
 

Korn, E.L., and Graubard, B.I. (1998) Confidence intervals for proportions with small expected number of positive counts estimated from survey data. Survey Methodology, 24, 193-201.
 

Korn, E.L., and Graubard, B.I. (1999), Analysis of Health Surveys, New York: Wiley.
 

Lohr, S. (1999). Sampling: Design and Analysis. Duxbury Press.
 

Luong, M. (2010). The financial impact of student loans. Perspectives on Labour and Income. Statistics Canada Catalogue no. 75-001-X. 
http://www.statcan.gc.ca/pub/75-001-x/2010101/article/11073-eng.htm (accessed December 9, 2010).
 

Oaxaca, R.L. (1973). “Male-female wage differentials in urban labor markets.” International Economic Review. 14, 3: 693–709.
 

Park, I. and Lee, H. (2004). Design Effects for the Weighted Mean and Total Estimators Under Complex Survey Sampling. Survey Methodology, 30, 183-193.
 

Pfeffermann, D. (1993). The Role of Sampling Weights when Modeling Survey Data. International Statistical Review, vol. 61, no. 2, pp. 317-337.
 

Pfeffermann, D. (1996). The Use of Sampling Weights for Survey Data Analysis. Statistical Methods in Medical Research, 5, 239-261.
 

Pfeffermann, D. and Sverchkov, M. (2003). Fitting Generalized Linear Models Under Informative Sampling. In Analysis of Survey Data (R.L. Chambers and C.J. Skinner, eds.), 175-195, Chichester: Wiley.
 

Rao, J.N.K. and Scott, A.J. (1981). The analysis of categorical data from complex sample surveys: Chi-squared tests for goodness of fit and independence in two-way tables. Journal of the American Statistical Association, 76, 221-230.
 

Rao, J.N.K. and Scott, A.J. (1984). On chi-squared tests for multi-way tables with cell proportions estimated with survey data. Annals of Statistics, 12, 46-60.