Aller au contenu principal
Automated Cell Annotation Tool From an Integrated Cell Atlas of Bronchoalveolar Lavage in Healthy Control
Macrophages, the most abundant lung immune cells, are crucial in diseases like asthma, COPD, and fibrosis. Traditional flow cytometry provides limited insights into macrophage subtypes, whose heterogeneity affects lung function and disease. scRNA-seq enables detailed characterization but existing studies lack scale and consistency. We analyze bronchoalveolar lavage (BAL) scRNA-seq data (33,538 cells, 13 healthy subjects) and integrate it with the human lung cell atlas (347,333 cells). Cell types are harmonized at multiple resolutions, and robust marker genes are identified. We develop a linear discriminant analysis-based automated annotation tool refined through ensemble learning. With the independent test on COVID-19 BAL datasets (66,452 cells), our tool achieved the highest F1-score compared with other annotation tools. Applied to an in-house BAL dataset, it revealed disease-specific immune shifts. We present an automated annotation tool and build a large-scale BAL reference atlas.
Outil d'annotation cellulaire automatisé à partir d'un atlas intégré des cellules du lavage broncho-alvéolaire chez des témoins sains
Les macrophages, les cellules immunitaires pulmonaires les plus abondantes, jouent un rôle crucial dans des maladies telles que l'asthme, la MPOC et la fibrose. La cytométrie en flux traditionnelle fournit des informations limitées sur les sous-types de macrophages, dont l'hétérogénéité affecte la fonction pulmonaire et la maladie. Le scRNA-seq permet une caractérisation détaillée, mais les études existantes manquent d'échelle et de cohérence. Nous analysons les données scRNA-seq du lavage broncho-alvéolaire (LBA) (33 538 cellules, 13 sujets sains) et les intégrons à l'atlas des cellules pulmonaires humaines (347 333 cellules). Les types de cellules sont harmonisés à des résolutions multiples et des gènes marqueurs robustes sont identifiés. Nous développons un outil d'annotation automatisé basé sur l'analyse discriminante linéaire et affiné par l'apprentissage d'ensemble. Lors du test indépendant sur les ensembles de données LBA COVID-19 (66 452 cellules), notre outil a obtenu le score F1 le plus élevé par rapport à d'autres outils d'annotation. Appliqué à un ensemble de données LBA interne, il a révélé des changements immunitaires spécifiques à la maladie. Nous présentons un outil d'annotation automatisé et construisons un atlas de référence du LBA à grande échelle.
Date and Time
-
Co-auteurs (non y compris vous-même)
Li Xing
University of Saskatchewan
Xiaojian Shao
National Research Council Canada
Ziying Liu
National Research Council Canada
Kailun Bai
University of Victoria
Xuekui Zhang
University of Victoria
Don Sin
University of British Columbia
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais

Speaker

Edit Name Primary Affiliation
Yushan Hu University of Victoria