Aller au contenu principal

Traitement parallèle en R

Le 12 Juin, 9:00 am – 12:00 pm, 1:30 – 4:00 pm
Hao Yu, University of Western Ontario 
 

Il faut énormément de puissance de calcul pour analyser les gros ensembles de données si communs aujourd’hui dans des domaines tels la bioinformatique et les mathématiques financières. De même, les progrès en méthodologie statistique ont conduit à l’introduction de solutions de plus en plus exigeantes en capacité de traitement. Face à cette augmentation du volume de données et à ces nouvelles exigences de simulation, on peut recourir au traitement parallèle, technique qui permet de décomposer un gros calcul en petites tâches qui peuvent être exécutées en parallèle sur de multiples unités centrales. Dans cet atelier, nous mettons l’accent sur le traitement parallèle en R via parallélisme explicite. Le principal paquet R utilisé est Rmpi, interface pour MPI (Message Passing Interface), qui est la norme de facto en traitement parallèle. Rmpi peut s’exécuter sur un ordinateur de bureau ou portatif avec un/des unité(s) centrale(s) multi-cœur ou sur un groupe de centaines ou milliers d’unités centrales. Ainsi, un groupe de cent unités centrales permet de réduire le temps de simulation ou de calcul de six mois à quelques jours. L’ordre du jour de l’atelier sera le suivant : (1) Qu’est-ce que le calcul parallèle et quelle est son utilité en calcul statistique? (2) Comment monter ou utiliser un ordinateur/groupe parallèle? (3) Quelques opérations MPI de base (4) Comment utiliser les fonctions d’application parallèle pour ce qu’on appelle le « parallélisme embarrassant » (5) Programmation MPI avancée; (6) Autres outils parallèles en R, notamment le paquet snow. Pour plus d’informations, veuillez consulter http://www.stats.uwo.ca/faculty/yu/Rmpi.