Winnow-KAN: Single-Cell Spatial Localization with a Small Gene Set via a Kolmogorov-Arnold Network

Single-cell RNA sequencing (scRNA-seq) provides detailed gene expression profiles but lacks spatial context. Conventional deep-learning approaches that integrate scRNA-seq with spatial transcriptomics data often rely on high-dimensional gene profiles, which limits scalability and generalizability. In this talk, we present Winnow-KAN, a novel representation learning framework built on a modified Kolmogorov-Arnold Network. By incorporating a selector layer, Winnow-KAN automatically identifies a minimal yet informative set of gene features that are then used for location prediction, achieving accurate cell localization with far fewer variables than standard deep neural network methods. This framework also facilitates the development of pre-trained models applicable across multiple datasets. Extensive benchmarking on spatial transcriptomics data demonstrates that our low-dimensional representations preserve predictive performance while enhancing scalability and interpretability.

Winnow-KAN : localisation spatiale à cellule unique avec un petit ensemble de gènes par l’entremise d’un réseau Kolmogorov-Arnold

Le séquençage de l’ARN à cellule unique (scRNA-seq) fournit des profils d’expression génique détaillés, mais manque de contexte spatial. Les approches conventionnelles d’apprentissage profond qui intègrent le scRNA-seq avec des données transcriptomiques spatiales s’appuient souvent sur des profils de gènes à grande dimension, ce qui limite l’évolutivité et la généralisation. Dans cet exposé, nous présentons Winnow-KAN, un nouveau cadre d’apprentissage de représentation construit sur un réseau de Kolmogorov-Arnold modifié. En incorporant une couche de sélection, Winnow-KAN identifie automatiquement un ensemble minimal et tout de même informatif de caractéristiques génétiques qui sont ensuite utilisées pour la prédiction de la localisation, ce qui permet d’obtenir une localisation cellulaire précise avec beaucoup moins de variables que les méthodes standard de réseaux neuronaux profonds. Ce cadre facilite également le développement de modèles préentraînés applicables à de multiples ensembles de données. Une analyse comparative approfondie des données transcriptomiques spatiales démontre que nos représentations à faible dimension préservent la performance prédictive tout en améliorant son extensibilité et son interprétation.

Session

Representation Learning for Unstructured Data

Date and Time