Référence: 2205289F

/

Mise à jour le

Text mining

Data Value

Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

Niveau de sortie : Sans Niveau spécifique

Pour cette formation

1 session disponible

Consulter

Objectifs

Découvrir comment décrire, comparer, classer, analyser des ensembles de textes.
Il peut s'agir de textes littéraires, scientifiques (bibliométrie, recherche documentaire), économiques, sociologiques (réponses aux questions ouvertes dans des enquêtes socio-économiques, entretiens divers en marketing, psychologie appliquée, pédagogie, médecine), de textes historiques, politiques…

Programme

- Introduction
  • Présentation de l’analyse statistique textuelle
  • Domaines d’application
  • Exemples d’utilisation
  • Présentation du logiciel de traitement
- Importation des données
  • Les diverses natures et sources de données textuelles utilisables
  • Procédures d’importation selon la nature des données
  • Exemples d’importation
- Codification : du texte brut au tableau statistique
  • Données textuelles et données contextuelles
  • Création du tableau lexical : la création des documents
  • Prétraitement des données textuelles (mise en forme, lemmatisation)
  • Dictionnaire des termes
- Analyse descriptive
  • Calcul de la fréquence de mots : identifier les termes ou concepts les plus récurrents
  • Bilan lexical par document, par variable de contexte
  • Table de dissimilarité entre documents ou entre modalités de variable contexte
  • Spécificités : termes sur- ou sous-représentés dans une modalité d’une variable de contexte
  • Co-occurrences : termes spécifiques des documents qui contiennent un terme donné.
  • Contexte dans lequel un mot est cité, permet d’éclairer le sens du texte
  • Nuage de mots (« word_cloud »)
- Analyse multidimensionnelle
  • Permet de révéler le sens profond des données textuelles et de synthétiser l’information contenue dans les données
  • Analyse factorielle des correspondances (examen multidimensionnel du lien des termes entre eux, avec les documents et avec les variables de contexte)
  • Classification ascendante hiérarchique des documents en groupes homogènes au regard des termes et des variables de contexte
- Traitement complet d’un exemple réel

Certifications et métiers visés

Consulter le diplôme, titre ou certificat... délivrés en fin de formation ainsi que les métiers auxquels cette formation vous donne accès.

Résultats attendus

- Se familiariser avec l'analyse textuelle
- Connaître les étapes de qualification et de formatage des données brutes en vue d'y appliquer les méthodes d'analyse statistique
- Mener une analyse descriptive du texte (fréquence des mots, bilan lexical, table de dissimilarité, co-occurences, nuage de mots,….)
- Approfondir l'analyse au moyen de techniques multidimensionnelles

1 session : Text mining

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)

    Formation professionnelle