Skip to main content
Concerning Boxplots: Modifications for Skewed and Left-Censored Data
Boxplots are simple yet efficient tools for summarizing and visualizing the distribution of continuous data. While an effective method for exploratory data analysis, Tukey-style boxplots are sensitive to skewed data and may identify a greater-than-expected number of values as potential outliers. Environmental data are often skewed and may also be left-censored, with some values below analytical limits of detection. These characteristics complicate the application of traditional boxplots for data visualization. Here, outlier identification by traditional and modified boxplots was evaluated. Boxplots were constructed using the Kaplan-Meier estimator from Monte Carlo simulated datasets spanning a range of sample sizes, from small to medium, to emulate real-life data. Simulations were drawn from symmetric, left-, and right-skewed distributions and were subjected to uniform and non-uniform left-censoring. Results provide insight into the utility of boxplots for unconventional data.
Sur les boîtes à moustaches : modifications pour des données asymétriques et censurées à gauche
Les boîtes à moustaches sont des diagrammes simples mais efficaces pour résumer et visualiser la distribution des données continues. Bien qu'il s'agisse d'une méthode efficace pour l'analyse exploratoire des données, les boîtes à moustaches traditionnelles de Tukey sont sensibles aux données asymétriques et peuvent identifier à tort de nombreuses observations comme des valeurs aberrantes potentielles. Or les données environnementales sont souvent asymétriques et peuvent contenir des données censurées à gauche, avec certaines valeurs inférieures aux limites analytiques de détection. Ces caractéristiques compliquent l'application des boîtes à moustaches traditionnelles pour la visualisation des données. Ici, nous évaluons l'identification des valeurs aberrantes par des boîtes à moustaches traditionnelles et modifiées. Nous construisons des boîtes à moustaches à l'aide de l'estimateur de Kaplan-Meier, à partir d'ensembles de données simulés par Monte Carlo couvrant une gamme de petits à moyens échantillons, imitant des données environnementales réelles. Les simulations sont dérivées de distributions symétriques, asymétriques à gauche, et asymétriques à droite, et sont soumises à une censure à gauche uniforme et non uniforme. Les résultats permettront de mieux comprendre l'utilité des boîtes à moustaches pour les données non conventionnelles.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Nelson Arthur Zabel WSP Canada Inc.