Aller au contenu principal
Pengfei Li
Prix CRM-SSC en statistique
2022

Le prix CRM-SSC en statistique reconnaît l’excellence et l’accomplissement d’un ou d’une chercheur(e) en statistique pour leur recherche pendant les quinze années suivant leur doctorat (ou diplôme équivalent). Il est décerné annuellement par le Centre de recherches mathématiques et la SSC.

Le lauréat de cette année est Pengfei Li de l’Université de Waterloo. 
 

 

 

Né en 1979, Pengfei a grandi dans un petit village de la province chinoise de Hubei. Il a étudié la statistique à l’Université Nankai en Chine, où il a obtenu sa licence et sa maîtrise en statistique en 2001 et 2004, respectivement. La thèse de maîtrise de Pengfei porte sur les plans factoriels fractionnaires optimaux et leur construction ; elle a donné lieu à sept publications dans des revues statistiques réputées. En plus de terminer sa thèse de maîtrise, Pengfei a travaillé quatre mois comme assistant de recherche avec Donggeng Wang à l’Université baptiste de Hong Kong. Au cours de cette période, ils ont appliqué avec succès la conception uniforme à l’étude des transports ; leur travail aboutit à deux publications dans des revues sur les transports.
 

Pengfei a été admis à l’Université de Waterloo pour des études supérieures en 2004, où il a obtenu son doctorat en trois ans et quatre mois, sous la supervision conjointe des professeurs Jiahua Chen (médaillé d’or 2014 de la SSC) et Paul Marriot. Après des études postdoctorales avec le professeur Jiahua Chen à l’Université de la Colombie-Britannique, Pengfei a rejoint le Département des sciences mathématiques et statistiques de l’Université de l’Alberta en 2008. Le Département de statistique et d’actuariat de l’Université de Waterloo a recruté Pengfei en 2012 ; il a été promu au rang de professeur agrégé en 2014 et au rang de professeur titulaire en 2019.
 

En l’espace de15 ans après son doctorat, Pengfei s’est imposé comme un chercheur de renommée internationale avec un portefeuille de recherche exceptionnel dans les domaines des modèles de mélanges finis, de la vraisemblance empirique, du modèle de rapport de densité, des problèmes de capture-recapture et des échantillons d’enquête non probabilistes. Pengfei compte à son actif environ 70 publications dans des revues et deux chapitres de livres. Parmi celles-ci, huit sont parues dans La revue canadienne de statistique (RCS), et 18 dans Annals of Statistics (AOS), Biometrika (Bio), Biometrics, Journal of the American Statistical Association (JASA), et Journal of the Royal Statistical Society: Series B (JRSSB).
 

Parmi ses contributions originales, significatives et marquantes, le travail de Pengfei sur les modèles de mélanges finis mérite une mention spéciale, comme le détaillent toutes les lettres de soutien de la nomination. Résoudre des problèmes statistiques dans le cadre de modèles de mélanges est atrocement difficile en raison de leur manque de propriétés de régularité. Les premiers résultats asymptotiques s’arrêtent souvent au niveau de la preuve de concept, sans mener à aucune procédure d’inférence concrète. Les travaux pionniers de Pengfei sur les tests EM (Li, Chen et Marriott, 2009, Bio ; Chen et Li, 2009, AOS ; Li et Chen, 2010, JASA ; Chen, Li et Fu, 2012, JASA) ont considérablement repoussé ces limites. Pour tester l’ordre du modèle de mélange fini, les nouveaux tests EM examinent à quelle vitesse plutôt que de combien la vraisemblance augmente du modèle nul aux modèles alternatifs. Cela a permis de réduire la sophistication technique et de produire de nombreux résultats asymptotiques soignés. Plus important encore, ce travail théorique a permis la création de tests EM efficaces et faciles à mettre en œuvre.
 

Les tests EM, comme LASSO, exigent une spécification des valeurs des paramètres d’accord. Il y a peu d’exemples à suivre puisque les valeurs des paramètres d’accord n’affectent pas l’asymptotique du premier ordre. Chen et Li (2011, CJS) ont inventé à cette fin l’approche de l’expérience informatique. La créativité et l’originalité de cette contribution ont été reconnues dans une lettre de soutien à la nomination, dont les commentaires sont cités comme suit : « Ces méthodes devraient également être utiles dans d’autres domaines où les paramètres d’accord doivent être spécifiés. »
 

Le modèle du rapport de densité semi-paramétrique (MRD) est une plateforme souple où combiner des informations provenant de sources multiples et qui permet des solutions d’inférence élégantes grâce à la vraisemblance empirique. Pengfei et ses collaborateurs ont fait progresser l’utilisation du MRD dans plusieurs domaines importants de recherche et d’application. Li et Qin (2011, JASA) et Li, Liu et Qin (2017, JASA) emploient le MRD pour résoudre le problème des paires de chromosomes homologues non ordonnés et former des modèles de mélanges génétiques semi-paramétriques. Ils ont découvert que les propriétés asymptotiques du test du rapport de VE dépendent de la dégénérescence de la matrice d’information de Fisher. Comme le souligne une lettre de soutien à la nomination, « Il s’agit d’une observation unique qui fournit une solution entièrement satisfaisante au problème appliqué et un nouveau domaine de recherche théorique. » Qin, Zhang, Li, Albanes et Yu (2015, Bio) ont illustré le potentiel d’utiliser le MRD pour intégrer des données existantes provenant de grandes études de cohorte afin d’améliorer l’efficacité de l’analyse d’une nouvelle étude. Dans la même lettre de soutien mentionnée ci-dessus, il est dit : « L’existence de telles informations auxiliaires est courante et cela ouvre un domaine de recherche potentiellement important. »
 

L’article novateur de Pengfei dans Biometrika, Liu, Li et Qin (2017), révolutionne l’analyse des données de capture-recapture en utilisant des informations auxiliaires par le biais de la vraisemblance empirique. Il conduit à une solution beaucoup plus satisfaisante pour l’intervalle de confiance de la taille de la population. Un referee les a exhortés à diffuser largement leur méthode auprès des utilisateurs du monde réel.
 

Rien n’indique que Pengfei est en train de se former une zone de confort sur la base de ces réalisations étonnantes. Ses derniers travaux sur l’analyse des données provenant d’un échantillonnage d’enquête non probabiliste innovent (Chen, Li et Wu, 2020, JASA). L’article développe un cadre général, basé sur les scores de propension, pour incorporer les échantillons d’enquête non probabilistes dans l’inférence sur la base d’un échantillon d’enquête correctement conçu. Il s’agit d’une approche novatrice dans un domaine très important, car les échantillons d’enquête non probabilistes sont si faciles à collecter à l’ère du big data.
 

L’excellence de la recherche de Pengfei a été reconnue par son financement par le CRSNG et trois prix pour rendement exceptionnel de l’Université de Waterloo. Il excelle également dans l’enseignement de la statistique : il a remporté deux fois des prix d’enseignement. Il est rédacteur en chef adjoint de La revue canadienne de statistique et de Metrika. Il a été membre des comités d’organisation de huit conférences internationales. Il est responsable du programme scientifique du congrès annuel 2022 de la SSC.
 

Pengfei attribue son succès à sa famille, qui l’a entièrement soutenu dans sa carrière, ainsi qu’à son superviseur, ses mentors, ses collaborateurs, ses collègues et ses étudiants, tous inspirés et merveilleux. Pengfei et sa femme, Weihong, ont un fils, Daniel, et une fille, Katelyn. 
 

Citation Accompanying the Award / Criteria / Award Delivery

«À Pengfei Li, pour ses contributions de recherche novatrices et pionnières au test EM pour l’ordre des modèles de mélanges finis ; pour ses développements méthodologiques originaux et créatifs dans les domaines de la vraisemblance empirique, des modèles de rapport de densité, de la génétique statistique, des échantillons d’enquête non probabilistes ; pour sa productivité de recherche exceptionnelle; et pour l’excellence de son enseignement de la statistique.»