Ce cours présente une introduction aux techniques de traitement de données textuelles et aux applications de ces techniques dans un contexte de gestion. Plus particulièrment, le cours propose une vue d'ensemble de l'usage des grands modèles de langage (LLM) ainsi que d'agents spécialisés pour le traitement automatique du langage naturel (TALN).
Le cours aborde également plusieurs concepts importants permettant de comprendre le fonctionnement des LLM. Finalement, il fournit des illustrations de comment les LLM sont utilisés en pratique pour l'exploitation de sources d'information sous forme de texte (nouvelles, sites Web, courriels, réseaux sociaux, rapports publics et privés, etc.), notamment la recherche et la classification de documents, la génération de texte et la production de résumés et de synthèses.
Introduction à l'exploitation des données textuelles et mise en contexte.
Nettoyage de données textuelles avec Python
Introduction aux modèles Bag of Words et n-grammes
Introduction à la sémantique vectorielle et aux mesures de similarité pour les données textuelles
La classification de texte
Utilisation des LLM pour l'exploitation des données textuelles
Introduction aux systèmes agentiques en TALN