Ce cours offre un cadre unifié pour la prise de décision sur un horizon de planification dans un environnement incertain, en se concentrant sur les techniques d'optimisation stochastique. Plusieurs classes de problèmes de ce type et leurs méthodes de résolution sont étudiées. Chaque classe de problèmes est motivée et illustrée à l'aide d'applications réelles de l'analytique d'affaires.
Le cours fournit aux personnes étudiantes un ensemble d'outils diversifiés pour aborder les problèmes de prise de décision séquentielle dans l'incertitude en utilisant l'optimisation stochastique. Ils apprennent à modéliser ces problèmes de manière efficace et à sélectionner les stratégies de solution les plus appropriées, allant des méthodes d'optimisation classiques aux techniques avancées utilisant les réseaux neuronaux et l'apprentissage par renforcement. Le cours nécessite une bonne compréhension de la pensée algorithmique et de la programmation informatique.
Optimisation stochastique avec ou sans dérivées
Processus de décision markoviens et programmation dynamique
Programmation dynamique approximative
Apprentissage par renforcement
Réseaux neuronaux et apprentissage par renforcement profond
Programmation stochastique à deux étapes / multi-étapes
Conception de politiques pour des problèmes séquentiels