Estimation robuste en cas de contamination « cellwise » ou « casewise »

En statistique robuste traditionnelle, on présume généralement que la majorité des observations sur les données sont libres de contamination et que seule une minorité est contaminée. Ces dernières sont identifiées comme valeurs aberrantes et sous-pondérées même si un seul composant de l’observation est contaminé. Certaines observations s’écartent entièrement de l’essentiel des données : on parle alors de valeurs aberrantes « casewise » (par cas). Toutefois, d’autres observations peuvent n’être que partiellement contaminées. Ce type de contamination apparaît souvent comme de simples cellules aberrantes dans une matrice de données : on parle alors de contamination « cellwise » (par cellule). Si la contamination ne concerne qu’une cellule, on perdrait beaucoup d’informations en sous-pondérant l’ensemble de l’observation, surtout pour des données de haute dimension. De récents travaux ont montré que les procédures typiquement employées ne sont pas robustes. Dans cette présentation, nous ébauchons une méthode d’estimation des paramètres de position et dispersion multivariés en cas de contamination cellwise et casewise.

Date/Heure: 

Mercredi, 14 juin, 2017 - 14:15 - 15:00

Co-auteurs (non y compris vous-même) : 

Victor J. Yohai
Universidad de Buenos Aires
Ruben H. Zamar
University of British Columbia

Langue de la présentation: 

English

Langue des supports visuels: 

Bilingual

Type de présentation: 

Invited

Session: 

Orateur

Prénom Second prénom Nom de famille Affiliation primaire
Andy Leung The University of British Columbia