Aller au contenu principal
Data Source
The Canadian Open Parkinson Network (C-OPN, https://copn-rpco.ca/)
Organizer
Dr. Juan Li and Dr. Michael Schlossmacher; Ottawa Hospital Research Institute


(Le français suit)

Background

Parkinson disease (PD) and atypical parkinsonism

PD is a progressive, neurodegenerative disorder that results from the loss of specific, dopamine-producing cells in the brain. This leads to the cardinal motor signs, including muscle stiffness, slowness of movement, rest tremor, and poor balance and coordination, which prompts the working diagnosis of PD; a positive response to L-dopa treatment and progression of symptoms over time will confirm the diagnosis. The disease, however, is not only restricted to motor impairments; non-motor symptoms include a loss of sense of smell, constipation, sleep disturbances, and depression and anxiety, some of which are present years before motor signs appear.1 PD is the second commonest neurodegenerative disease, following Alzheimer’s disease. The worldwide pooled prevalence of PD is estimated at 1.51 cases per 1000, 9.34 cases per 1000 among individuals older than 60 years, and prevalence is higher in males than in females.2 In Canada, PD is currently estimated to impact over 110,000 Canadians directly,3,4 and to cost the country \$3.3 billion annually; these numbers are expected to grow by 40,000 individuals and an additional \$1.1 billion in annual costs by 2034.3

Atypical parkinsonism (aka PD-plus syndrome) represents a group of disorders that share some signs with PD, such as tremor, slowness and stiffness (i.e. parkinsonism), but patients have additional symptoms that may progress faster and benefit less from L-dopa medication (or not at all).1,5 Theses disorders include multiple-system atrophy (MSA), progressive supranuclear palsy (PSP), corticobasal degeneration (CBD) and dementia with Lewy bodies (DLB). These conditions are often difficult to differentiate from PD and each other.1,5 An accurate and easy-to-use diagnostic model to help with the differentiation is an unmet need. 

The Canadian Open Parkinson Network (C-OPN)

C-OPN is “a pan-Canada initiative bridging people, data, and resources to accelerate Parkinson’s disease (PD) discoveries”,6,7 which now includes 11 major Movement Disorders centres in Canada across 5 provinces and has recruited 2,318 participants (PD: 84%; PD-plus: 4.6%; neurologically healthy controls (HC): 11.4%). C-OPN is an invaluable resource to support various PD-research projects by providing a comprehensive de-identified database containing demographic, epidemiological, clinical information, and various PD-related assessment tools and instruments.

Implementing statistical/machine learning models in healthcare

Since its advent in 1950s, machine learning (ML) has been used in various fields, including healthcare.8,9 In healthcare settings, ML has been used to develop prognostic/diagnostic tools and personalized treatment plans.9,10 However, despite the exploding number of new developments and publications, there is still a huge implementation gap of machine learning in healthcare – very few of these algorithms ever make it to the clinics.11 Seneviratne et al. talked about some key factors that limit the broader adoption of ML models in healthcare: actionability (of the output), safety, and utility. Another factor that should be considered is the actionability of the input – what variables to be included into the model and what are their implications for the future clinical implementation. The current case study challenge is designed for study participants to be aware of, and consider these elements when developing a new algorithm, and to understand the importance of collaboration with domain experts at every stage of the project.
 
*******************

Contexte

Maladie de Parkinson (MP) et parkinsonisme atypique

La MP est une maladie neurodégénérative progressive qui résulte de la perte de cellules spécifiques productrices de dopamine dans le cerveau. Cela entraîne des signes moteurs caractéristiques, notamment une raideur musculaire, une lenteur des mouvements, des tremblements au repos, ainsi qu’un mauvais équilibre et une mauvaise coordination, ce qui conduit au diagnostic provisoire de MP ; une réponse positive au traitement à la L-dopa et la progression des symptômes au fil du temps confirmeront le diagnostic. Cependant, la maladie ne se limite pas à des troubles moteurs ; les symptômes non moteurs comprennent une perte de l’odorat, de la constipation, des troubles du sommeil, ainsi que de la dépression et de l’anxiété, dont certains sont présents plusieurs années avant l’apparition des signes moteurs.1 La MP est la deuxième maladie neurodégénérative la plus courante, après la maladie d’Alzheimer. La prévalence mondiale de la maladie de Parkinson est estimée à 1,51 cas pour 1 000 personnes, 9,34 cas pour 1 000 personnes âgées de plus de 60 ans, et la prévalence est plus élevée chez les hommes que chez les femmes.2 Au Canada, on estime actuellement que la maladie de Parkinson touche directement plus de 110 000 Canadiens,3,4 et coûte au pays 3,3 milliards de dollars par an ; ces chiffres devraient augmenter de 40 000 personnes et de 1,1 milliard de dollars supplémentaires en coûts annuels d’ici 2034.3

Le parkinsonisme atypique (également appelé syndrome Parkinson-plus) désigne un groupe de troubles qui partagent certains signes avec la maladie de Parkinson, tels que les tremblements, la lenteur et la raideur (c.-à-d. le parkinsonisme), mais les patients présentent des symptômes supplémentaires qui peuvent progresser plus rapidement et bénéficier moins (voire pas du tout) du traitement à la L-dopa.1,5 Ces troubles comprennent l’atrophie des systèmes multiples (ASM), la paralysie supranucléaire progressive (PSP), la dégénérescence cortico-basale (DCB) et la maladie à corps de Lewy (MCL). Ces affections sont souvent difficiles à différencier de la MP et les unes des autres.1,5 Il existe un besoin non satisfait pour un modèle diagnostique précis et facile à utiliser afin d’aider à la différenciation. 

Le Réseau Canadian Parkinson Ouvert (RPCO)

Le RPCO est « une initiative rassemblant des personnes, des données et des ressources pour accélérer les découvertes sur la maladie de Parkinson »,6,7 qui comprend désormais 11 grands centres spécialisés dans les troubles du mouvement au Canada, répartis dans 5 provinces, et qui a recruté 2 318 participants (MP : 84 % ; Parkinson-plus : 4,6 % ; témoins neurologiquement sains (TS) : 11,4 %). Le RPCO est une ressource inestimable pour soutenir divers projets de recherche sur la MP en fournissant une base de données complète et anonymisée contenant des informations démographiques, épidémiologiques et cliniques, ainsi que divers outils et instruments d’évaluation liés à la MP.

Mise en œuvre de modèles statistiques/d’apprentissage automatique dans le domaine des soins de santé

Depuis son apparition dans les années 1950, l’apprentissage automatique (AA) est utilisé dans divers domaines, notamment les soins de santé.8,9 Dans le domaine des soins de santé, l’AA a été utilisé pour développer des outils de pronostic/diagnostic et des plans de traitement personnalisés.9,10 Cependant, malgré l’explosion du nombre de nouveaux développements et de publications, il existe encore un énorme fossé dans la mise en œuvre de l’apprentissage automatique dans le domaine des soins de santé : très peu de ces algorithmes parviennent jusqu’aux cliniques.11 Seneviratne et al. ont évoqué certains facteurs clés qui limitent l’adoption à plus grande échelle des modèles d’apprentissage automatique dans le domaine des soins de santé : l’applicabilité (des résultats), la sécurité et l’utilité. Un autre facteur à prendre en compte est l’exploitabilité des données d’entrée : quelles variables inclure dans le modèle et quelles sont leurs implications pour la future mise en œuvre clinique. Le défi de l’étude de cas actuelle est conçu pour que les participants à l'étude prennent conscience de ces éléments et les prennent en compte lors du développement d’un nouvel algorithme, et pour qu’ils comprennent l’importance de la collaboration avec des experts du domaine à chaque étape du projet.
 

Research Question


Question de l’étude

  1. À l’aide des données du Réseau Canadian Parkinson Ouvert (RPCO), pouvez-vous développer et valider un modèle de classification permettant de distinguer les patients atteints de la maladie de Parkinson (MP) de ceux atteints de parkinsonisme atypique (Parkinson-plus) ainsi que des témoins sains ? 
    Remarques
     
    1. Vous êtes libre d’explorer des modèles statistiques et/ou d’apprentissage automatique standard. Les modèles plus simples ont l’avantage d’être explicables et plus faciles à mettre en œuvre, mais ce n’est pas obligatoire.
    2. L’objectif principal est d’obtenir un modèle de classification pour la MP et le syndrome Parkinson-plus. Cependant, il est préférable d’explorer des modèles qui permettent une classification multi-classes de la MP, du Parkinson-plus et des témoins neurologiquement sains.
    3. Il convient toutefois de noter que Parkinson-plus est un terme générique qui désigne diverses maladies neurologiques. Si le modèle permet également de différencier ces maladies, c’est un plus. (Cela pourrait toutefois s’avérer trop ambitieux, compte tenu notamment de la taille relativement réduite de l’échantillon du groupe Parkinson-plus).
    4. En ce qui concerne la validation, vous devrez évaluer dans quelle mesure le modèle se généralise à des données non observées afin d’éviter des problèmes tels que le surajustement. Il est recommandé d’utiliser des méthodes de validation interne, par exemple la division train-test, la validation croisée, le bootstrapping, etc. De plus, comme le RPCO est une étude pancanadienne multicentrique, il est également possible de sélectionner des données provenant d’un ou plusieurs sites spécifiques comme ensemble de données de validation externe.
    5. Nous vous encourageons vivement à prendre en compte la mise en œuvre des modèles : pour les modèles qui ont des performances similaires, ceux qui sont plus faciles à mettre en œuvre obtiendront de meilleures notes. Le niveau de difficulté de mise en œuvre de chaque variable est défini dans le dictionnaire de données :
      Niveau 1 : La variable est basée sur une question qui peut être auto- déclarée.
      Niveau 2 : La variable est un score total ou un sous-score d’un questionnaire auto-déclaré. L’utilisation de cette variable nécessite de remplir l’intégralité du questionnaire ou plusieurs questions de celui-ci.
      Niveau 3 : L’utilisation de cette variable nécessite l’aide de professionnels, mais cela se fait déjà couramment en clinique.
      Niveau 4 : L’utilisation de cette variable nécessite des ressources supplémentaires de la part de professionnels pour sa mise en œuvre.
       
  2. Nous sommes également ouverts à divers défis que vous identifiez et souhaitez choisir (par exemple, sur la question des caractéristiques cliniques spécifiques au sexe/genre parmi les groupes diagnostiques, ou concernant leurs antécédents d’exposition environnementale). Si vous souhaitez travailler sur une autre question de recherche après avoir examiné les données du RPCO et que vous n’êtes pas sûr que votre ou vos questions de recherche correspondent à l’objectif du concours, veuillez consulter J. Li ou M. Schlossmacher.

Informations sur le prix
Nous sommes heureux d’annoncer que l’équipe gagnante recevra un prix de 3 000 \$. Ce prix est parrainé par le Consortium de recherche sur la maladie de Parkinson d’Ottawa, avec le soutien et la contribution active de personnes atteintes de la maladie de Parkinson. En plus de la récompense financière, les membres de l’équipe gagnante pourraient se voir offrir des opportunités de recherche ou de collaboration.

Variables

Source et accès aux données

  1. Ensemble de données : fichier csv unique (format tabulaire). Toutes les données du RPCO sont anonymisées et approuvées par le comité d’éthique de la recherche (CER) de tous les sites participants. Tous les participants ont donné leur consentement éclairé par écrit, soit en personne, soit par voie électronique.
  2. Cohorte de l’étude : Le RPCO est une étude nationale multicentrique qui comprend 2 318 participants (MP : 84 % ; Parkinson-plus : 4,6 % ; note1  TS : 11,4 %).6,7,note2  Les diagnostics ont été posés par des spécialistes des troubles du mouvement au Canada, conformément aux critères de la Movement Disorder Society (MDS)15 ou à des critères publiés précédemment, tels que ceux de la UK Brain Bank. Le groupe Parkinson-plus comprend des patients ayant reçu un diagnostic d’ASM, PSP, DCB, MCL, démence frontotemporale (DFT), tremblement essentiel (TE) et trouble du comportement pendant le sommeil paradoxal (TCSP). Par rapport à d’autres cohortes hautement sélectionnées dans la recherche sur la MP, la cohorte du RPCO offre une plus grande diversité sur le plan géographique, ethnique et phénotypique, représentant ainsi un groupe plus réaliste d’individus généralement observés dans les cabinets de neurologie. Une mise en garde s’impose toutefois en raison de la taille relativement petite de l’échantillon du groupe de TS et, compte tenu de la manière dont les témoins neurologiquement sains ont été recrutés, certains biais de recrutement peuvent être observés, en particulier pour des variables telles que les antécédents familiaux de MP.
    Remarques :
    1. Dans les données du RPCO, le groupe Parksinson-plus comprend d’autres maladies rares au-delà des quatre troubles mentionnés ci-dessus (pour plus de détails, voir le dictionnaire de données) ; la plupart d’entre elles représentent également des maladies neurodégénératives.
    2. Chiffres basés sur les données antérieures à juillet 2025. La base de données RPCO est constamment mise à jour, le nombre de recrutements peut donc varier dans l’ensemble de données utilisé pour cette étude de cas.
  3. Résultat d’intérêt : Classification des groupes PD et Parkinson-plus. La classification multi-classes PD vs Parkinson-plus vs témoins neurologiquement sains (TS) et/ou la classification entre les affections Parkinson-plus est un bonus.
  4. Caractéristiques : La base de données RPCO complète et anonymisée sera fournie, voir le dictionnaire de données. Vous êtes libre d’explorer toutes les informations disponibles dans la base de données, mais une sélection des caractéristiques est attendue, afin de n’inclure que les variables les plus pertinentes et les plus informatives.
  5. Dictionnaire de données : Inclus dans le kit de formation, voir ci-dessous.
  6. Accès aux données : Un accord d’utilisation des données (inclus dans le kit de formation) sera signé par toutes les équipes participantes et envoyé au RPCO (Anna Bendas,anna.bendas@hec.ca), après quoi l’accès sera accordé à l’ensemble de données hébergé sur la plateforme REDCap.

Kit de formation
Veuillez consulter ce lien « Data Files » ci-dessous pour obtenir tous les documents inclus dans le kit de formation :

  1. Description de l’étude
  2. Dictionnaire de données RPCO avec annotations
  3. Accord d’utilisation des données
  4. Fichier README pour aider à comprendre les données et le dictionnaire de données
  5. Modèle de protocole pour demande d'autorisation éthique
  6. Instruments standardisés (questionnaires et évaluations) remplis sur chaque site du RPCO, aimablement fournis par l’équipe du RPCO.

Coordonnées des organisateurs
Juan Li, PhD 
Associé principal de recherche clinique, Programme de neurosciences, Institut de recherche de l’Hôpital d’Ottawa ; Ottawa, ON, Canada. 
Courriel : juli@ohri.ca

Michael Schlossmacher, MD, DABPN, FRCPC
Chercheur principal, Programme de neurosciences, Institut de recherche de l’Hôpital d’Ottawa ; Ottawa, ON, Canada.
Courriel : mschlossmacher@toh.ca