Référence: 251257048F

/

Mise à jour le

Cassandra

Réseau Formateurs

Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

Niveau de sortie : Sans Niveau spécifique

Pour cette formation

1 session disponible

Consulter

Objectifs

Se connecter aux moteurs opérationnels
Utiliser l'outil intégré ETL Apache Sqoop
Utiliser l'outil de traitement de données distribué Apache Spark
Exploiter les fonctionnalités outils et algorithmes de recherche tels que les moteurs de recherche Google Search et l'algorithme PageRank
Utiliser différents types de traitements tels que MapReduce, graphe orienté acyclique, flux, machine learning et graphes distribués

Programme

Se connecter aux moteurs opérationnels
- Comprendre les moteurs opérationnels, leur fonctionnement et leur relation
- Configurer la connexion
- Identifier les avantages et les inconvénients de la connexion
- Évaluer l'impact de la connexion
- Tester la connexion pour s'assurer de son fonctionnement et de sa sécurité
- Diagnostiquer et résoudre les problèmes de connexion
Utiliser l'outil intégré ETL Apache Sqoop
- Comprendre le rôle d'Apache Sqoop dans la gestion des données et son intégration
- Configurer Sqoop pour extraire, transformer et charger les données de Cassandra
- Optimiser les performances d'Apache Sqoop pour une utilisation efficace
- Surveiller les opérations ETL pour détecter les erreurs et les problèmes de performance
- Synchroniser les données entre Cassandra et les autres sources de données en utilisant Apache Sqoop
- Personnaliser les scripts Sqoop pour répondre aux besoins spécifiques de l'entreprise
Utiliser l'outil de traitement de données distribué Apache Spark
- Comprendre le rôle d'Apache Spark dans le traitement de données distribué
- Configurer Apache Spark pour l'utiliser
- Analyser les résultats de traitement de données en utilisant Apache Spark
- Utiliser Apache Spark pour le traitement en temps réel et le traitement de flux de données
- Utiliser les bibliothèques de Machine Learning d'Apache Spark pour l'analyse de données
- Personnaliser les scripts Apache Spark pour répondre aux besoins spécifiques de l'entreprise
 Search et l'algorithme PageRank
- Comprendre le fonctionnement des moteurs de recherche
- Appliquer l'algorithme PageRank pour optimiser les résultats de recherche dans Cassandra
- Évaluer l'efficacité de l'algorithme PageRank pour l'optimisation des résultats de recherche
- Comparer l'algorithme PageRank à d'autres algorithmes de recherche pour choisir le plus adapté
Utiliser différents types de traitements tels que MapReduce, graphe orienté acyclique, flux, machine learning et graphes distribués
- Comprendre les différents types de traitements de données
- Appliquer MapReduce pour la gestion de données en utilisant Hadoop MapReduce
- Utiliser des graphes orientés acycliques (DAG)
- Exploiter les flux de données pour traiter
Traiter les données à l'aide de graphes distribués
- Explorer les différentes méthodes pour l'analyse de graphes
- Traiter des flux de données en temps réel avec Apache Kafka
- Examiner comment appliquer des techniques de machine learning aux données stockées dans Cassandra
- Etudier des algorithmes de graphes populaires tels que PageRank et Shortest Path
- Gérer de la mémoire pour les graphes distribués
- Voir comment les graphes distribués sont utilisés dans différents domaines

Certifications et métiers visés

Consulter le diplôme, titre ou certificat... délivrés en fin de formation ainsi que les métiers auxquels cette formation vous donne accès.

Résultats attendus

Attention, cette formation ne conduit pas à une certification ou une habilitation inscrite au RNCP.

1 session : Cassandra

  • au

    Réseau Formateurs

    Cet organisme a obtenu la marque « Qualiopi » pour ses actions de formation.

    • Distanciel
    • Session terminée

    Formation professionnelle