Ce cours présente les concepts fondamentaux en analyse de données et apprentissage statistique, ainsi que les bases de la modélisation prédictive.
Ce cours présente les méthodes de base et certaines avancées en apprentissage non-supervisé (par exemple technique de réduction de la dimensionnalité, analyse de regroupement) et supervisé (par exemple modèle paramétriques, arbres et forêts aléatoires, boosting). Des exemples d'application en gestion illustrent l'utilisation de ces méthodes.
- Bases de l'apprentissage supervisé et non supervisé.
- Réduction de la dimensionnalité (composantes principales et analyse factorielle).
- Analyse de regroupements hiérarchique et non hiérarchique.
- Bases de la modélisation prédictive : division de l'échantillon validation-croisée bootstrap.
- Modèles paramétriques pour la modélisation prédictive.
- Règles d'association (analyse du panier de la ménagère).
- Méthode de partitionnement récursif de base : CART forêt aléatoire importance des variables boosting d'arbres.
- Autres sujets : machines à vecteur de support méthodes des plus proches voisins analyse de survie de base données manquantes.