Incorporating Weighted Block Sampling Techniques in Epidemic Curve Classification
In infectious disease systems, transmission is time-dependent and often peaks during the middle of the epidemic period. Individual-level models (ILMs) are commonly used to study transmission dynamics and are typically fitted using a Bayesian MCMC framework, which can be computationally intensive. An efficient alternative is model-classification techniques, such as Random Forests. However, standard random forests treat all predictors equally by randomly selecting split points, ignoring temporal dependencies.
This research proposes a block-sampling-based random forest, assigning larger probability weights to blocks containing more relevant information, such as those with the epidemic peak. The method samples split points randomly but uses the weighted blocks for selection. We validate this method using the U.K. 2001 foot-and-mouth outbreak and simulated data. Results show that block-forest classifiers outperform standard random forests, offering improved accuracy in epidemic prediction.
This research proposes a block-sampling-based random forest, assigning larger probability weights to blocks containing more relevant information, such as those with the epidemic peak. The method samples split points randomly but uses the weighted blocks for selection. We validate this method using the U.K. 2001 foot-and-mouth outbreak and simulated data. Results show that block-forest classifiers outperform standard random forests, offering improved accuracy in epidemic prediction.
Intégration de technique d'échantillonnage par blocs pondérés dans la classification des courbes épidémiques
Dans les systèmes de maladies infectieuses, la transmission dépend du temps et atteint souvent son maximum au milieu de la période épidémique. Les modèles au niveau individuel (ILM) sont couramment utilisés pour étudier la dynamique de la transmission et sont généralement ajustés à l'aide d'un cadre MCMC bayésien, qui peut s'avérer lourd en termes de calcul. Les techniques de classification par modèles, telles que les forêts aléatoires, constituent une alternative efficace. Cependant, les forêts aléatoires standard traitent toutes les variables prédictives de la même manière en sélectionnant aléatoirement les points de séparation, sans tenir compte des dépendances temporelles.
Cette recherche propose une forêt aléatoire basée sur l'échantillonnage de blocs, attribuant des poids plus importants aux blocs contenant des informations plus pertinentes, telles que celles du pic épidémique. La méthode échantillonne les points de séparation de manière aléatoire, mais utilise les blocs pondérés pour la sélection. Nous validons cette méthode en utilisant l'épidémie de fièvre aphteuse de 2001 au Royaume-Uni et des données simulées. Les résultats montrent que les classifieurs de forêts par blocs sont plus performants que les forêts aléatoires standard, offrant une meilleure précision dans la prévision des épidémies.
Cette recherche propose une forêt aléatoire basée sur l'échantillonnage de blocs, attribuant des poids plus importants aux blocs contenant des informations plus pertinentes, telles que celles du pic épidémique. La méthode échantillonne les points de séparation de manière aléatoire, mais utilise les blocs pondérés pour la sélection. Nous validons cette méthode en utilisant l'épidémie de fièvre aphteuse de 2001 au Royaume-Uni et des données simulées. Les résultats montrent que les classifieurs de forêts par blocs sont plus performants que les forêts aléatoires standard, offrant une meilleure précision dans la prévision des épidémies.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais