Référence: 2100653F

/

Mise à jour le

Analyse de données en environnement Hadoop

Data Value

Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

Niveau de sortie : Sans Niveau spécifique

Pour cette formation

1 session disponible

Consulter

Objectifs

  • Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
  • Savoir explorer HDFS et suivre l’exécution d’une application YARN
  • Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Programme

- Hadoop
  • Comprendre Hadoop 2.0 et son écosystème
  • Quels impacts de l’arrivée d’Hadoop dans un SI traditionnel ?
  • Le Hadoop Distributed File System (HDFS)
  • Introduction aux données dans HDFS
  • MapReduce Framework et YARN
- Pig
  • Introduction à Pig
  • Programmation Pig avancée
  • Troubles hooting et optimisation avec Pig
  • Résolution des problèmes avec Pig
  • Utiliser l’UI Web d’Hadoop
  • Démo optionnelle : résolution d’un « Failed Job » avec l’UI Web
  • Échantillonnage de données et débogage
  • Vue d’ensemble des performances
  • Comprendre le plan d’exécution
  • Astuces pour améliorer la performance de vos « Pig Jobs »
- Hive
  • Programmation Hive
  • Utilisation de HCatalog
  • Programmation Hive avancée
  • Étendre Hive
  • Transformation de données avec des Scripts personnalisés
  • Fonctions définies par l’utilisateur
  • Paramétrer les requêtes
  • Exercices « Hands-On » : transformation de données avec Hive
  • Programmation Hive avancée (suite)
  • Analyse de données et statistiques
- Sqoop
  • Import/Export avec Sqoop (SGBDR <-> HDFS)
  • Sqoop, fonctions avancées
  • Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
  • Introduction à H-Base
  • Exemple d’ingestion de données avec l’ETL Talend
  • Créer son propre cluster Hadoop (plateforme de test).

Certifications et métiers visés

Consulter le diplôme, titre ou certificat... délivrés en fin de formation ainsi que les métiers auxquels cette formation vous donne accès.

Résultats attendus

- Comprendre ce que sont Hadoop et YARN
- Connaître les différents outils et les Framework dans un environnement Hadoop
- Appréhender MapReduce
- Comprendre comment exécuter une tâche de MapReduce sur YARN
- Exécuter des modifications en masse avec PIG
- Savoir écrire des requêtes pour HIVE afin d’analyser ses données
- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
- Découverte d’autres briques : automatiser vos process avec Oozie
- Utiliser une base de données No-SQL (HBase)

1 session : Analyse de données en environnement Hadoop

  • au

    Data Value

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Commune : Lyon 2e (69)

    Formation professionnelle