Fin des inscriptions: Vendredi 26 février 2027

Dates: Du 11 mars au 17 juin 2027
Horaire: Jeudis soirs, de 18h00 à 21h00
Mode d’enseignement: En ligne
Langue d’enseignement: Anglais
Durée: 45 heures

Description

Dans ce cours, les apprenants aborderont des thèmes liés aux grands modèles linguistiques (LLM) et à l’IA d’entreprise, ainsi que leur lien avec le déploiement sécurisé et la gestion du cycle de vie.

Plus précisément, ce cours abordera les thèmes suivants :

  • Comprendre le cycle de vie complet des grands modèles linguistiques (LLM) dans un contexte d’entreprise.
  • Déployer en toute sécurité des LLM open source privés, tels que Llama 3, sur les serveurs internes de l’entreprise.
  • Mettre en place des pipelines de génération augmentée par la recherche (RAG) pour interroger en toute sécurité les données propriétaires.
  • Concevoir des points de terminaison API robustes et à débit limité pour une intégration transparente dans les applications internes.
  • Surveiller les hallucinations, la latence et la dérive des modèles à l’aide de stacks d’observabilité modernes.
  • Appliquer des pratiques d’ingénierie des prompts évolutives pour garantir des résultats d’IA cohérents et fiables.
  • Optimiser les ressources de calcul et l’utilisation des GPU pour une inférence IA rentable.
  • Appliquer des mesures de protection strictes en matière de confidentialité des données afin d’empêcher la fuite d’informations sensibles de l’entreprise.

Prérequis et autres informations importantes

Prérequis

  • Connaissance de base de la programmation en Python (variables, fonctions, boucles, bibliothèques).
  • Familiarité avec les API REST et les concepts de base du cloud (AWS, GCP ou Azure) – facultatif.
  • Expérience préalable des concepts d’apprentissage automatique ou un cours d’initiation à l’IA/ML vivement recommandé.
  • Expérience de travail dans un environnement de terminal Linux – un atout.
  • Compréhension du contrôle de version (Git) et des pipelines CI/CD de base est un plus.
  • Vous devez vous assurer de disposer d’une connexion Internet stable et d’un appareil capable de prendre en charge une réunion Teams, avec un microphone et une caméra fonctionnels. Il vous appartient également de vérifier que votre appareil est compatible avec les applications et/ou les logiciels abordés dans le cours, le cas échéant.

Exigences matérielles

  • CPU : processeur quad-core récent, 2,5 GHz ou plus rapide (8-core recommandé pour l’inférence locale de modèles)
  • RAM : 16 Go minimum — 32 Go fortement recommandés pour exécuter simultanément des pipelines LLM et des services containerisés.
  • GPU : un GPU NVIDIA dédié avec 6 Go ou plus de VRAM (par exemple, RTX 3060 ou supérieur) est fortement recommandé pour les laboratoires de fine-tuning et d’inférence locale de modèles.  Les étudiants ne disposant pas d’un GPU compatible devront recourir à des alternatives basées sur le cloud (abordées dans le cours) — facultatif.
  • Stockage : au moins 60 Go d’espace libre sur SSD — les poids de modèles LLM et les ensembles de données peuvent être très volumineux.
  • Réseau : connexion Internet haut débit pour accéder aux instances GPU dans le cloud (AWS SageMaker, Google Colab Pro ou Azure ML) et récupérer des poids de modèles depuis Hugging Face.

Exigences logicielles

  • Python 3.10 ou version ultérieure avec les bibliothèques essentielles : LangChain, LlamaIndex, Hugging Face Transformers, FastAPI, Pydantic.
  • Docker Desktop — pour les pipelines LLMOps en conteneurs.
  • Git et un compte GitHub — pour le suivi des expériences avec contrôle de version.
  • VS Code ou JetBrains PyCharm (l’édition Community est gratuite).
  • Compte cloud : AWS Free Tier, Google Colab (gratuit) ou Azure for Students — au moins un compte requis.
  • Ollama ou LM Studio — pour exécuter des LLM open source en local (facultatif mais recommandé).
  • Système d’exploitation : Ubuntu 22.04 LTS fortement recommandé ; macOS 13+ (Apple Silicon pris en charge) ; Windows 11 avec WSL2.

Assiduité et comportement en classe virtuelle

Ce cours exige votre présence physique et une participation active, régulière et constante à vos travaux individuels. Il vous incombe de réaliser les travaux qui vous sont assignés et d’être connecté et prêt à travailler dans les cinq premières minutes du cours.

Participation active

Bien que l’utilisation de la caméra reste facultative, une participation active implique que l’apprenant prenne part aux discussions, réponde et pose des questions, que ce soit oralement ou via le chat intégré à la réunion, et participe aux exercices en groupe et/ou individuels. Les commentaires de l’instructeur sont pris en compte pour vérifier que la participation de l’apprenant répond aux critères requis pour la délivrance du certificat.

Des certificats de réussite électroniques seront remis aux étudiants ayant assisté et participé activement à au moins 80 % des cours prévus. Nous ne délivrerons plus de certificats papier.