Plus d'info sur IFP Energies nouvelles - Sciences et Technologies du Numérique
Stage Informatique - Développement Hauts-de-Seine entre mars et mai 2026 5 mois
IFP Energies nouvelles (IFPEN) est un acteur majeur de la recherche et de la formation dans les domaines de l’énergie, du transport et de l’environnement. Depuis les concepts scientifiques en recherche fondamentale jusqu’aux solutions technologiques en recherche appliquée, l’innovation est au cœur de son action, articulée autour de quatre orientations stratégiques : climat, environnement et économie circulaire ; énergies renouvelables ; mobilité durable ; hydrocarbures responsables.
Dans le cadre de la mission d’intérêt général confiée par les pouvoirs publics, IFPEN concentre ses efforts sur l’apport de solutions aux défis sociétaux et industriels de l’énergie et du climat, au service de la transition écologique. Partie intégrante d’IFPEN, IFP School, son école d’ingénieurs, prépare les générations futures à relever ces défis.
IFP Energies Nouvelles dispose d’une base documentaire hétérogène composée entre autres de nombreux rapports PDF historiques et de fichiers de logs de puits au format LAS. Ces documents ont été produits pour des objectifs spécifiques (par exemple, l’évaluation de la présence d’hydrocarbures). Or, ces mêmes données pourraient être réexploitées dans des contextes différents, comme l’évaluation du potentiel de stockage géologique du CO₂.
Aujourd’hui, notre moteur de recherche basé sur le framework OpenSearch indexe ces documents avec des métadonnées et du texte extrait des documents. Cependant, cette indexation reste très dépendante du contexte initial avant d’être ingérée dans la base et ne permet pas d’exploiter pleinement la valeur implicite des contenus pour d’autres usages.
L’objectif du stage est d’étudier et de prototyper l’utilisation des fonctionnalités vectorielles d’OpenSearch pour enrichir/updater les index existants par des représentations sémantiques (embeddings).
L’idée est de construire un pipeline permettant :
Étudiant·e en Master 2 Informatique, Data Science, IA ou équivalent
Mots-clés
Opensearch, Base Vectorielle, embeddings, NLP, Modèles de langage, Similarité sémantique
Stage Informatique - Développement Hauts-de-Seine entre février et septembre 2026 6 mois
Stage Informatique - Développement Hauts-de-Seine entre février et mai 2026 5 mois
Stage Informatique - Développement Hauts-de-Seine entre mars et mai 2026 5 mois
Stage Informatique - Développement Rhône entre janvier et juin 2026 4 mois
Stage Informatique - Développement Rhône entre janvier et juin 2026 4 mois
IFP Energies nouvelles - Sciences et Technologies du Numérique
Jean-François LECOMTE