Formation
La programmation statistique
Formation en programmation et analyse des données

Les langages de programmation statistique permettent de manipuler des ensembles de données, produire des analyses et construire des graphiques élaborés. Par exemple, le langage R est un des langages de prédilection en apprentissage machine (machine learning), il est supporté par une grande communauté de chercheurs et contributeurs du monde entier. L’environnement R est de type source libre (open source). Cette formation a pour but de fournir les bases requises pour débuter des projets d’analyse, de programmation et de forage de données (data mining) en R.
Objectifs
- Effectuer les manipulations courantes d’une table de données (trier, filter, sélectionner, fusionner, etc.)
- Importer, nettoyer, organiser et exporter des fichiers de données
- Créer des graphiques simples pour visualiser les données
- Écrire des fonctions sur mesure réutilisables
- Savoir chercher de l’aide dans la communauté R
Personnes visées
- Toute personne désirant utiliser un langage de programmation pour manipuler des données et générer des rapports.
- Ce cours requiert de connaître les bases de la programmation informatique, peu importe le langage.
Format
- Virtuel ou présentiel
- Présentation, démonstrations, exercices pratiques et ateliers
- Durée : 16 heures (ou 4x 4 heures)
Contenu
- L’environnement R et RStudio
- Types de variables
- Vecteurs, matrices et dataframes, sélection de sous-ensembles
- Opérations élémentaires et logiques
- Structure des énoncés « if-else », boucles « for » et « while »
- Structure des fonctions sur mesure réutilisables
- Concept de fonction vectorisée et de boucle implicite
- Comment trouver de l’aide sur le web
- Ateliers pratiques et exercices : importer un fichier de données; obtenir des statistiques descriptives; construire des graphiques simples; faire une analyse de Pareto; rédiger une fonction sur mesure et l’appeler; copier-coller des résultats et graphiques vers d’autres logiciels
Prérequis
- Être familier avec l'informatique en général
- Idéalement avoir en tête des cas d'utilisation
- Avoir installé le logiciel R (suivre le lien)
- Avoir installé la version gratuite de RStudio
Pour de plus d’informations ou pour planifier votre formation, n’hésitez pas à nous contacter : info@difference-gcs.com