Référence: 241243992F

/

Mise à jour le

Réaliser ses analyses statistiques avec Python

Data Value

Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

Niveau de sortie : Sans Niveau spécifique

Pour cette formation

3 sessions disponibles

Consulter

Objectifs


Apprendre à utiliser le langage Python pour analyser des données. Mettre en œuvre avec Python les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.

Programme

- Introduction et mise en place de l'environnement
  • Installation et configuration des environnements (Anaconda, Jupyter Notebook)
  • Présentation des bibliothèques Python clés pour les statistiques (Pandas, Matplotlib, Scipy, Statsmodels)

- Manipulation et nettoyage des données
  • Chargement et exploration des données avec Pandas
    • Lecture/écriture de fichiers CSV, Excel, JSON
    • Traitement des données manquantes
    • Gestion des types de données et transformations

- Analyses exploratoires des données (EDA)
  • Calculs de statistiques descriptives
    • Moyennes, médianes, quartiles, variance, écart-type
    • Création de résumés statistiques groupés
  • Visualisations avec Matplotlib et Seaborn
    • Histogrammes, boxplots, nuages de points

- Introduction aux tests statistiques
  • Bases des tests d'hypothèses
    • Concepts : p-value, seuils de significativité, hypothèses nulle et alternative
  • Tests courants avec SciPy
    • Test t (indépendant et pairé)
    • Tests de normalité (Shapiro-Wilk)
    • Tests du chi-carré pour les tables de contingence
  • Interprétation des résultats

- Régression linéaire et introduction à la modélisation
  • Introduction aux modèles linéaires
    • Régression linéaire simple avec Statsmodels
    • Analyse des coefficients et des résidus
  • Régression multiple
    • Construction d’un modèle avec plusieurs variables explicatives
    • Validation du modèle (tests de significativité, R²)
  • Introduction à la régression logistique
    • Concepts de base et mise en œuvre pour les données catégoriques

- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide de la bibliothèque Prince

Certifications et métiers visés

Consulter le diplôme, titre ou certificat... délivrés en fin de formation ainsi que les métiers auxquels cette formation vous donne accès.

Résultats attendus

Attention, cette formation ne conduit pas à une certification ou une habilitation inscrite au RNCP.
- Maîtriser les bases de la manipulation de données avec Pandas
- Réaliser des analyses descriptives et des tests statistiques avec SciPy et Statsmodels
- Produire des visualisations avancées avec Matplotlib et Seaborn
- Implémenter des modèles de régression linéaire et logistique
- Automatiser les workflows d'analyse statistique
- Découvrir les principales méthodes d'analyse multidimensionnelle des données

Métier(s) correspondant(s)

Nom du métier Lien vers la fiche du métier
M1403 : Études et prospectives socio-économiques Fiche métier - nouvel onglet

3 sessions : Réaliser ses analyses statistiques avec Python

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)

    Formation professionnelle

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)
    • Session terminée

    Formation professionnelle

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)
    • Session terminée

    Formation professionnelle