Soutenance de thèse d’Hassan Ghraieb

24 juin 2022

Hassan Ghraieb soutient sa thèse de doctorat en Mathématiques Numériques, Calcul Intensif et Données le 24 juin 22.

Sur le couplage de l'apprentissage par renforcement profond et de la mécanique des fluides numérique

Hassan Ghraieb a effectué sa thèse dans l'équipe CFL. Sa soutenance aura lieu le 24 juin 2022 devant le jury suivant :

– Prof. Ramon Codina, Université Polytechnique de Catalogne, Espagne, rapporteur

– Prof. Anil Anthony Bharath, Imperial College, Londres, U.K., rapporteur

– Dr. Nissrine Akkari, SafranTech, examinateur

– Dr. Anca Bleme, Sorbonne Université, examinateur

– Prof. Elie Hachem, CEMEF Mines Paris, Directeur de thèse

– Dr.  Philippe Meliga, CEMEF Mines Paris, Co-encadrant de thèse

– IR Jonathan Viquerat, CEMEF Mines Paris, Maître de thèse

 

Résumé :

Cette thèse évalue la pertinence des techniques d'apprentissage par renforcement profond (DRL) pour le contrôle optimal en mécaniques des fluides. L'apprentissage par renforcement (RL) est le processus par lequel un agent apprend par essai et erreur les actions à prendre de façon à optimiser une récompense quantitative au cours du temps. Dans un contexte d'apprentissage par renforcement profond (deep RL ou DRL), l'agent est un réseau de neurones profond imitant les circuits formés par les neurones du cerveau humain. Le couplage entre algorithmes DRL et les codes de mécanique des fluides numérique (CFD) à la pointe de l'état de l'art, ainsi que leur implémentation dans un contexte de calcul haute performance, constituent les nouveautés et l'objectif principal de la thèse. L'environnement CFD utilisé pour calculer la récompense fournie au DRL est basé sur la méthode des éléments finis stabilisés multi-échelles de type Variational Multiscale (VMS), dans laquelle la solution est décomposée a priori en une grande échelle résolue et une petite échelle modélisée au travers de termes sources proportionnels aux résidus des équations du problème grande échelle. En ce qui concerne les algorithmes DRL, deux approches différentes sont considérées. La première, dans laquelle l'agent interagit avec son environnement une fois par épisode dans le but d'apprendre le mapping d'un état d'entrée constant à une action optimale (single-step DRL), vise les problèmes de contrôle en boucle ouverte, dans lesquels une quantité est optimisée via des paramètres d'actuation pré-définis (par exemple, une vitesse d'entrée constante). La seconde, dans laquelle l'agent interagit plusieurs fois par épisode afin d'apprendre une relation état-action plus complexe (multi-step DRL), est plus pertinente pour les problèmes de contrôle en boucle fermée, où des mesures de l'écoulement sont utilisées afin d'ajuster en permanence les paramètres d'actuation. Plusieurs cas-tests en deux et trois dimensions (en régime d'écoulement laminaire et turbulent) sont présentés afin d'évaluer la pertinence, la précision et les performances de ces méthodes, en particulier pour les problèmes de réduction de traînée et de contrôle thermique. Les résultats obtenus soulignent le potentiel élevé de l'approche DRL-CFD devraient permettre d'accélérer le développement du DRL et son application à des problématiques concrètes d'intérêt industriel.
 
 
Mots-clés : Apprentissage par Renforcement Profond, Réseaux de neurones, Mécanique des fluides numérique, Eléments finis stabilisés VMS, Contrôle d’écoulements, Contrôle thermique
 
 
 

 

 

Découvrir les autres actualités liées

Des éthers de cellulose aux bio-aérogels: Vers des vecteurs de médicaments sans additifs Sujie Yu a réalisé sa thèse sous la direction de Tatiana Budtova et de Rudy Valette. Elle présente ses […]
Contrôle des propriétés des biomatériaux polymères via l'ingénierie macromoléculaire et les paramètres de traitement Sijtze soutient son Habilitation à Diriger les Recherches le 19 juin 2025 à […]
Première présentation lors d'une conférence et premier prix du meilleur poster pour Carla Vincent ! Nous sommes très heureux et très fiers aussi pour Carla Vincent, en 1ère année de thèse. Elle se […]
PhD defence of Adrien Talatizi
Simulation de propagation d’ondes ultrasonores dans les matériaux polycristallins Adrien Talatizi a réalisé sa thèse dans l'équipe MSR sous la direction de Marc Bernacki dans le cadre du […]
Polyéthylène et additifs : composition du plastique, préparation, broyage et impact sur la santé et l’environnement Veronika Khodyrieva a réalisé sa recherche doctorale dans l'équipe S&P […]
De la solution au réseau poreux : contrôler la morphologie et les propriétés des aérogels de cellulose Loris Gelas a réalisé sa thèse dans l'équipe S&P, sous la direction de Tatiana […]