Référence: 2100791F

/

Mise à jour le

Réaliser ses analyses statistiques avec R

Data Value

Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

Niveau de sortie : Sans Niveau spécifique

Pour cette formation

1 session disponible

Consulter

Objectifs

  • Apprendre à utiliser le logiciel R pour analyser des données.
  • Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.

Programme

Statistiques descriptives
  • Gestion d’un jeu de données - dataframe
  • Importation, caractérisation, sélection, sous-ensembles
  • Premières analyses d’un jeu de données
  • Premières vérifications, valeurs manquantes, recodage
  • Résumé d’une variable quantitative – numeric
  • Indicateurs numériques, représentations graphiques
  • Résumé d’une variable qualitative – factor
  • Indicateurs numériques, représentations graphiques
Intervalle de confiance
  • Le raisonnement à partir d’un échantillon
  • Généralités, échantillonnage, estimation d’un paramètre
  • Intervalle de confiance d’une moyenne
  • Intervalle de confiance d’une proportion
  • Intervalle de confiance d’une variance
Tests d’hypothèses
  • Test d’hypothèse
  • Généralités, règle de décision, risques d’erreur, puissance
  • Tests de conformité ou de comparaison à 1 norme
  • Conformité d’une moyenne, d’une proportion
  • Les tests de comparaison de deux populations
  • Comparaison de 2 moyennes, de 2 proportions
  • Test d’ajustement à 1 loi de probabilité normale
  • Test de Shapiro-Wilk
  • Intro aux tests non paramétriques
  • Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman
Liaisons entre 2 variables
  • Liaison entre 2 variables quantitatives
  • Nuage de points, intensité de la liaison, significativité
  • Liaison entre deux variables qualitatives
  • Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
  • Liaison entre une variable qualitative et quantitative
  • Comparaison de plusieurs populations, rapport de corrélation
  • Liaisons entre plusieurs variables
  • Approches graphiques : matrice de nuages de points, treillis
  • Caractériser des sous-populations par plusieurs variables
L’analyse de la variance – Anova
  • Analyse de la variance à un facteur
  • Variabilité inter, intra, totale – Rapport de corrélation - Test de Fisher
  • Comparaisons multiples de moyennes
  • Analyses post hoc, procédure de Tukey
  • Analyse de la variance à deux facteurs et interaction
  • Extensions de l’Anova
  • Modèle à effet fixe ou aléatoire, modèle hiérarchisé
Régression linéaire simple & multiple
  • De la corrélation à la régression
  • L’intérêt d’un modèle - Variables à expliquer, explicatives, erreur
  • La régression linéaire simple
  • Ajustement par la méthode des moindres carrés - Tests et validation du modèle
  • La régression linéaire multiple
  • Choix d’un modèle de régression
  • Pourquoi sélectionner un sous-ensemble de variables explicatives ?
  • Les différentes approches & critères de sélection d’un modèle
Analyse de données multidimensionnelles
 

Certifications et métiers visés

Consulter le diplôme, titre ou certificat... délivrés en fin de formation ainsi que les métiers auxquels cette formation vous donne accès.

Résultats attendus

- Importer, manipuler et analyser des données dans R
- Effectuer des analyses statistiques univariées
- Établir avec R des intervalles de confiance autour de paramètres comme moyenne, proportion et variance
- Réaliser les principaux tests d'hypothèses paramétriques et non paramétriques dans le logiciel
- Étudier numériquement et graphiquement la liaison entre 2 variables quantitatives, qualitatives ou de chaque nature
- Mettre en œuvre des analyses de la variance à un ou plusieurs facteurs pour la comparaison de moyennes de population
- Élaborer un modèle établissant une relation linéaire entre une variable à expliquer et une (régression simple) ou plusieurs (régression multiple) variables explicatives.
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide du package FactoMineR

1 session : Réaliser ses analyses statistiques avec R

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)

    Formation professionnelle