Skip to main content
First-Passage-Time Distributions of Scan Statistics with Applications to CNV Detection
Scan statistics are widely used for detecting clusters in survival analysis, reliability, and genomics, but their distribution is difficult to characterize due to dependence among overlapping windows. We present a unified first-passage-time framework showing that the scan statistic can be viewed as the first passage time of a stochastic process. Under general conditions, the limiting process converges to a Brownian bridge, yielding a Brownian bridge first-passage-time distribution.

When formulated as a hypothesis testing problem, accurate characterization of this distribution is essential for determining critical values. We develop a discrete approximation and show its convergence to the continuous-time model. The resulting exact and approximate distributions can be obtained using the finite Markov chain imbedding (FMCI) technique. Applications to cluster detection in nonhomogeneous Poisson processes are illustrated, motivated by copy number variation (CNV) detection.
Distributions du temps de premier passage des statistiques de balayage avec applications à la détection des CNV
Les statistiques de balayage sont largement utilisées pour détecter les grappes dans l'analyse de survie, la fiabilité et la génomique, mais leur distribution est difficile à caractériser en raison de la dépendance entre les fenêtres qui se chevauchent. Nous présentons un cadre unifié de temps de premier passage montrant que la statistique de balayage peut être considérée comme le temps de premier passage d'un processus stochastique. Dans des conditions générales, le processus limite converge vers un pont brownien, donnant une distribution de temps de premier passage du pont brownien.

Lorsqu'elle est formulée comme un problème de test d'hypothèse, une caractérisation précise de cette distribution est essentielle pour déterminer les valeurs critiques. Nous développons une approximation discrète et montrons sa convergence vers le modèle en temps continu. Les distributions exactes et approximatives qui en résultent peuvent être obtenues à l'aide de la technique d'intégration de chaînes de Markov finies (FMCI). Nous illustrons des applications à la détection de regroupements dans des processus de Poisson non homogènes, en nous basant sur la détection des variations du nombre de copies (CNV).
Date and Time
-
Additional Authors and Speakers (not including you)
Language of Oral Presentation
English
Language of Visual Aids
English

Speaker

Edit Name Primary Affiliation
Tung-Lung Wu Mississippi State University