Distance-based Approach to Independent Component Analysis
ICA models observations 𝒚 as a mixture of unobserved independent sources 𝒙 via an unknown invertible mixing matrix 𝑨, namely, 𝒚 = 𝑨𝒙. The goal of ICA is to estimate the unmixing matrix 𝑩 = 𝑨⁻¹ in order to extract 𝒙. Our work proposes a novel distance-based approach for estimating 𝑩 based on a square-error statistic ρ. The estimation minimizes the distance between the joint empirical DF and the product of marginal empirical DFs. We establish that ρ is asymptotically a U-statistic and derive its theoretical properties. We also analyze the empirical process to devise an estimation strategy for 𝑩. We develop two methods for constructing confidence intervals—one using the U-statistic and a special weight function that makes it independent of the source densities and another based on principal components of the empirical process. To ensure computational feasibility, we introduce a Gradient Descent-based algorithm to estimate 𝑩 and compare its performance against FastICA.
Analyse en composantes indépendantes basée sur la distance
L'ICA modélise les observations 𝒚 comme un mélange de sources indépendantes non observées 𝒙 via une matrice de mélange inversible inconnue 𝑨, à savoir 𝒚 = 𝑨𝒙. L'objectif de l'ICA est d'estimer la matrice de démixage 𝑩 = 𝑨-¹ afin d'extraire 𝒙. Notre travail propose une nouvelle approche basée sur la distance pour estimer 𝑩 sur la base d'une statistique d'erreur carrée ρ. L'estimation minimise la distance entre la fonction de répartition empirique conjointe et le produit des fonctions de répartition empiriques marginales. Nous établissons que ρ est asymptotiquement une U-statistique et dérivons ses propriétés théoriques. Nous analysons également le processus empirique afin de concevoir une stratégie d'estimation pour 𝑩. Nous développons deux méthodes pour construire des intervalles de confiance, la première utilisant la U-statistique et une fonction de pondération spéciale qui la rend indépendante des densités des sources, et la seconde basée sur les composantes principales du processus empirique. Pour garantir la faisabilité informatique, nous introduisons un algorithme basé sur la descente de gradient pour estimer 𝑩 et comparons ses performances à celles de FastICA.
Date and Time
-
Language of Oral Presentation
English
Language of Visual Aids
English