Heuristic Algorithms for Discrete Optimization with Cardinality and Cost Constraints in Two-Phase Study Design
Two-phase studies realize cost-efficiency by utilizing phase 1 data to select an informative subsample for expensive variable collection in phase 2. Previous work assumes equal cost of collecting expensive data across samples. Here, we challenge this assumption and investigate differential cost-constrained optimal two-phase designs. Our approach penalizes phase 2 subsamples based on budget constraint satisfaction. We compare three heuristic algorithms under heterogeneous per-sample costs: Genetic Algorithm (GA), Simulated Annealing (SA), and Comprehensive Evolutionary Algorithm (CEA). The resulting designs achieve minimal variance of the parameter of interest under the defined constraints. Simulations based on Poisson regression and inference via semiparametric maximum likelihood evaluate statistical performance across a range of design parameters. Briefly, GA and CEA consistently achieve best performance while SA exhibits greater variability and occasional convergence failures.
Algorithmes heuristiques pour l’optimisation discrète dans la conception des échantillonnages à deux phases soumis à des contraintes des cardinalités et de coûts différentiels
Les échantillonnages à deux phases permettent d’achever des économies en utilisant les données de la phase un pour sélectionner un sous-échantillon informatif pour la collecte de variables coûteuses dans la phase deux. Les travaux antérieurs supposent que le coût de la collecte de données coûteuses est le même pour tous les échantillons. Ici, nous remettons en question cette hypothèse en étudiant des méthodes optimales en deux phases soumises à des contraintes de coûts différentiels. Notre approche pénalise les sous-échantillons de la phase deux en fonction du respect des contraintes budgétaires. Nous comparons trois algorithmes heuristiques dans le cadre de coûts hétérogènes par échantillon : l'algorithme génétique (GA), le recuit simulé (SA) et l'algorithme évolutif complet (CEA). Les résultats des méthodes précédentes offraient une variance minimale du paramètre d'intérêt dans le cadre des contraintes définies. Des simulations basées sur la régression de Poisson et l'inférence via la vraisemblance maximale semi-paramétrique évaluent les performances statistiques pour toute une gamme de paramètres de conception. En résumé, le GA et le CEA obtiennent systématiquement les meilleures performances, tandis que le SA présente une plus grande variabilité et des échecs de convergence occasionnels.
Date and Time
-
Langue de la présentation orale
Anglais
Langue des supports visuels
Anglais