Formation : Data Science - Les fondamentaux
Présentation des outils et méthodologies de la Data Science
La Data Science est l’application de méthodes scientifiques mathématiques et statistiques au traitement de l’information. Dans le domaine du Big Data, le volume de données exploitables à disposition ne représenterait aucun intérêt s’il n’y avait pas l’intervention de la Data Science pour réaliser les premiers traitements préparatoires qui permettront par la suite leur interprétation par diverses solutions d’Intelligence Artificielle. Toute personne en charge de l’intégration d’une solution Big Data dans son entreprise devrait commencer par aborder les notions fondamentales de Data Science (méthodes et potentiels). En participant à ce séminaire de 2 jours, les participants s’initieront à la transformation de données pour aboutir aux interprétations les plus avancées rendues possibles par le Machine Learning et le Deep Learning.
- Compétences
- Data Science
- Machine Learning
- Big data
- Deep learning
- L’apprentissage machine
- Approche fonctionnelle de base
- Les variables prédictives
- Les variables à prédire
- Les fonctions hypothèses
- Les estimateurs (biais et variances)
- Le compromis biais – variance
- Les fonctions de perte
- La régularisation des paramètres
- Optimisation des paramètres
- Régression logistique
- Machines à vecteurs de support (SVM)
- Arbres de décisions
- K plus proches voisins (kNN)
- Prétraitement
- Compressions des données
- Réglages des modèles
- Principes de l’apprentissage d’ensemble
- Les forêts aléatoires
- Le gradient boosting
- Principes de la régression
- Explorations des données régressives
- Performance des modèles de régression
- Les k-moyens (kMeans)
- Le clustering hiérarchique
- L’approche DBSCAN
- Perceptron
- Réseaux neuronaux multicouches (MLP)
- Réseaux neuronaux convolutifs (CNN)
- Réseaux neuronaux récursifs (RNN)
Durée : 14h
Horaires : soirs / week-ends
Groupes de 5 à 10 personnes