Evaluation des méthodes d'IA générative à base de modèle de transport de type score diffusion, appliquées à la génération de champs de pression et de vitesse dans un écoulement turbulent par capteur

Plus d'info sur IFP Energies nouvelles

Stage Data / Mathématiques Appliquées Hauts-de-Seine entre mars et mai 2026 5 mois


IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. Depuis les concepts scientifiques en recherche fondamentale jusqu’aux solutions technologiques en recherche appliquée, l’innovation est au cœur de son action, articulée autour de quatre orientations stratégiques : climat, environnement et économie circulaire ; énergies renouvelables ; mobilité durable ; hydrocarbures responsables.

Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur l’apport de solutions aux défis sociétaux et industriels de l’énergie et du climat, au service de la transition écologique. Partie intégrante d’IFPEN, IFP School, son école d’ingénieurs, prépare les générations futures à relever ces défis.

Evaluation des méthodes d’IA générative à base de modèle de transport de type score diffusion, appliquées à la génération de champs de pression et de vitesse dans un écoulement turbulent par capteur

Les données de vitesse de vent sont indispensables pour l’optimisation dans le domaine des éoliennes, en permettant notamment de mieux prédire l’usure que subira une éolienne en fonction de ses caractéristiques et de son environnement. Ces données doivent être nombreuses, variées, et représentatives des épisodes climatiques qu’une éolienne affrontera, en fonction de son environnement climatique, de sa localisation géographique, ou des perturbations causées par d’autres éoliennes pouvant générer des perturbations difficiles à modéliser. Or, les campagnes d’acquisition de données par capteurs étant onéreuses et complexes à mettre en place, la quantité de données disponibles est fortement limitée.

Pour remédier à ce problème et étoffer ou se substituer aux jeux de données existants, de nombreuses méthodes de génération de vents synthétiques ont été développées pour simuler les propriétés physiques du vent. Cependant, le coût de calcul associé à ces méthodes grandit exponentiellement dès lors que l’on introduit des perturbations complexes. Ce coût élevé favorise en pratique des modèles plus simples et donc moins réalistes.

Une autre approche consiste à exploiter les outils statistiques en partant des données, plutôt que des modélisations physiques. Les mesures de vent sont alors modélisées comme une distribution de probabilité conditionnelle, qu’il s’agit alors d’estimer puis d’échantillonner pour générer les données à volonté. Pour garantir que ces outils de génération produisent des données réalistes, on utilise souvent des conditions (données acquises, contraintes physiques), pour guider la génération. Il est néanmoins important de vérifier que les bases de données générées explorent bien la distribution de probabilité attendue.

Les grandes avancées récentes dans le domaine de l’IA générative, notamment pour la génération de données séquentielles, fournissent un outil prometteur pour résoudre ce problème statistique.

Plusieurs architectures générales ont été adaptées pour le traitement spécifique des séries temporelles :

  • Les GAN (Generative Adversarial Networks, Goodfellow et al., 2014), et leurs adaptations récentes aux transformers, comme le modèle MTS-GAN (Madane et al., 2024).
  • Les modèles de diffusion (Sohl-Dickstein et al., 2015), adaptés aux séries temporelles dans des modèles récents tels que le SSSD (Alcaraz et Strodthoff, 2023), et Time Weaver (Narasimhan et al., 2024). Ces derniers modèles présentent des résultats prometteurs, notamment par leur capacité de généralisation et par le réalisme des données synthétisées.

En particulier, Time Weaver permet un contrôle fin dans le conditionnement des données générées, en intégrant plusieurs types de paramètres simultanément, qu’il s’agisse de variables catégoriques, continues, ou même de séries temporelles.

Objectifs

L’objectif de ce stage est de développer et d'évaluer un modèle de génération conditionnelle par méthode de diffusion, capable de générer des données de vent réalistes. L’accent sera mis sur l’analyse approfondie de sa capacité de généralisation, c'est-à-dire sa faculté à produire des séries qui recouvrent la distribution de probabilité sous-jacente aux données réelles, plutôt que copier les données originales.

Tâches :

  • Prise en main des modèles classiques de génération conditionnelle par méthode de diffusion sur des jeux de données standards d’images 2D.
  • En s’inspirant du modèle Time Weaver, mise au point d’un modèle génératif de diffusion adapté aux séries temporelles multivariées.
  • Implémentation et application du modèle au cas d’usage de la génération conditionnelle de vitesses de vent.
  • Analyse des conditions sous lesquelles le modèle est capable de généraliser et de produire des données réalistes et représentatives.

Profil

Étudiant(e) en dernière année de Master (M2) en mathématiques appliquées, science des données, apprentissage automatique (IA), ou élève ingénieur dans une école spécialisée dans ces domaines.

  • Une première expérience sur un projet concret impliquant des modèles génératifs (Diffusion, GANs, etc.) ou le traitement de séries temporelles est un atout majeur.
  • Une curiosité pour la modélisation physique (mécanique des fluides, dynamique des vents) ou pour les processus stochastiques.

Compétences :

  • Une maîtrise des concepts fondamentaux de l’apprentissage automatique et une forte appétence pour la programmation.

(PDF - Max : 5 Mo)
(PDF - Max : 5 Mo)

IFP Energies nouvelles Stage Alternance
contact

IFP Energies nouvelles
Simon QUERNE

Indemnité Oui

27 Annonces
Conseils
Pour que la vie d’étudiant ne rime pas avec parcours du combattant, retrouvez tous nos conseils stage / alternance / emploi