Comprendre l'intelligence artificielle et le Big Data
- Cerner les principes et enjeux de l'intelligence artificielle et du big data
- Retenir les 5V du big data : volume, vélocité, variété, véracité, valeur
- Appliquer le big data dans une entreprise
Analyser l'intelligence artificielle et le machine learning
- Définir l'Intelligence Artificielle : IA faible et IA forte
- Comprendre l'exploitation des données par les algorithmes
- Etudier le machine learning et le scoring
Contribuer aux projets Big Data
- Analyser les expressions et reconnaître les besoins
- User des expertises internes et externes
- Identifier les architectures logicielles
- Cerner les approches méthodologiques et la constitution d’équipes
Exploiter les technologies du Big Data
- Décrire l'architecture et les composants de la plateforme Hadoop
- Connaître les modes de stockage (NoSQL, HDFS)
- Maîtriser les principes de fonctionnement de MapReduce, Spark, Storm
- Déterminer les principales distributions du marché
- Installer une plateforme Hadoop
- Utiliser les technologies du datascientist
- Découvrir les technologies spécifiques pour le Big Data
Gérer les données structurées et non structurées
- Comprendre les principes de fonctionnement de Hadoop Distributed File System (HDFS)
- Importer des données externes vers HDFS
- Réaliser des requêtes SQL avec HIVE
- Utiliser PIG pour traiter la donnée
- Maîtriser le principe des ETL
- Gérer le streaming de données massive
Adopter les technique et les méthodes Big data analytics
- Découvrir les trois familles : Régression, Classification et Clustering
- Préparer les données
- Générer des modèles en R ou Python
- Découvrir les outils du marché
Découvrir la data visualisation et cas d'usage concrets
- Définir le besoin de la data visualisation
- Analyser et visualiser les données
- Utiliser les outils DataViz du marché
Passer de la donnée client au big data
- Etablir la base de données clients : typologie et modèles
- Comprendre le rôle du big data dans l’avènement des données non structurée
- Passer de l'analyse reporting à l'analyse prédictive
- Prioriser l'optimisation, la connaissance-client et les flux de données