Background
Asthma is a chronic condition and one measure of how well a subject’s asthma is controlled is by daily scoring of various asthma symptoms over a given time period. Common asthma symptoms recorded are cough, wheeze and shortness of breath. Each symptom is usually rated from 0-3: no symptoms, mild, moderate and severe. Symptoms during the day can be different than night symptoms. Also, use of rescue medication is a sign of poor control. However, this symptom score data may be summarised in several different ways and then also analysed in several different ways. This project is designed, via use of the data from two asthma trials, to assess whether differing methods of summary and analysis are more or less sensitive to detecting treatment differences, and whether one method provides summary statistics that are easier to understand and interpret. We have data from two 12 week large, multi-centre asthma trials available for this analysis.
The project
The overall aim of the project is to explore the use of different models for the repeated measurements of ordered categorical multi-dimensional symptoms data. Specific approaches that could be explored (but not limited to) include:
- appropriate summary measures. For example individual or combined scores; raw scores; percentage of symptom-free days; percentage of days with only mild symptoms.
- logistic regression, with each symptom/combined symptoms as a binary variable.
- extension of logistic regression to a generalised estimating equation (GEE) to allow for the serial correlation between the repeated measures of symptoms.
- proportional odds or continuation ratio models for an ordered categorical response.
Note: it is not expected that a project would cover all the areas listed above. A detailed exploration of one or two of the areas could make a useful project. For any of the models, a discussion of the following practical issues would be beneficial: (a) does the model produce a meaningful estimate of treatment effect, (b) can the model be fit successfully using standard software (e.g. SAS), (c) are the assumptions of the model met by the data. The following covariates are also of interest: country of recruitment, age, gender.
Explorer l’utilisation de différents modèles pour des données catégoriques de symptômes notées dans un journal quotidien par des sujets souffrant d’une condition chronique.
Ce projet convient à des étudiants qui souhaitent explorer et étudier des méthodes qui ne sont pas forcément couvertes en détail dans les programmes de M.Sc., mais qui connaissent d’importantes applications pratiques.
L’ensemble de données, disponible comme fichier SAS binaire, contient des données de scores de symptômes notés par les participants à 2 études (désignées comme A et B). Les variables sont brièvement décrites ci-dessous :
ITT = Le sujet appartient-il à la population retenue au début de l’étude?
ANA = Le sujet appartient-il à la population analysée? Donnée plus importante puisque c’est elle qui est utilisée pour les analyses primaires des scores de symptômes. La population analysée est identique à la population ITT, sauf qu’elle exclut les sujets d’un centre particulier où les données n’ont pas été collectées de façon satisfaisante.
TRTMNT = Traitement, FP ou Placebo.
AMWHEEZ = Score pour le symptôme « Respiration sifflante de jour »
AMCOUGH = Score pour le symptôme « Toux de jour »
AMBREATH = Score pour le symptôme « Manque de souffle de jour »
PMWHEEZ = Score pour le symptôme « Respiration sifflante de nuit »
PMCOUGH = Score pour le symptôme « Toux de nuit »
PMBREATH = Score pour le symptôme « Manque de souffle de nuit »
En ce qui concerne les variables ci-dessus, les scores ont les significations suivantes :
0 = symptômes inexistants
1 = symptômes bénins, pas gênants
2 = symptômes modérés
3 = graves, symptômes gênants
AMUSE = Utilisation de médicaments broncho-dilatateurs pendant la journée
PMUSE = Utilisation de médicaments broncho-dilatateurs pendant la nuit
Les 2 variables précédentes indiquent le nombre d’occasions auxquelles le médicament broncho-dilatateur Ventolin a été utilisé pour soulager les symptômes d’asthme.
DASMTDT = Date de l’observation dans le journal.
DAY = Numéro du jour à partir de la date à laquelle le sujet a reçu sont premier traitement (Jour 0). En d’autres termes, les jours –7 à –1 correspondent à la dernière semaine de référence.
FREQBASE = Description de la sévérité de l’asthme du sujet avant l’essai : Chronique persistant ou Épisodique (moins grave).
WDW = Le sujet a-t-il abandonné l’étude en cours?
WDWDT = Date de l’abandon (le cas échéant)
WDWREAS = Raison de l’abandon (le cas échéant)
AGE = Âge en années.
CENTRE = Centre d’essai.
- Ashby M et al. An annotated bibliography of methods for analysing correlated categorical data. Statistics in Medicine 11, 67-99 (1992).
- Lindsey JK et al. Simple models for repeated ordinal responses with an application to a seasonal rhinitis clinical trial. Statistics in Medicine 16, 2873-2882 (1997).