STAGE - Ingénieur(e) Recherche (H/F) - Deep Multi-Modal Retrieval

Réf. 312445-23935268

Stage - Informatique - Développement

Localisation : Yvelines

Début : dès que possible
Durée : de 4 à 6 mois
Indem. : à définir

Dassault Systèmes

Dassault Systèmes, « The 3DEXPERIENCE Company », offre aux entreprises et aux particuliers les univers virtuels nécessaires à la conception d’innovations durables. Ses solutions leaders sur le marché transforment pour ses clients, la conception, la fabrication et la maintenance de leurs produits. Les solutions collaboratives de Dassault Systèmes permettent de promouvoir l’innovation sociale et offrent de nouvelles possibilités d’améliorer le monde  réel grâce aux univers virtuels. 

CATIA, SOLIDWORKS, SIMULIA, DELMIA, ENOVIA, GEOVIA, EXALEAD, BIOVIA, NETVIBES, 3D VIA, 3DEXCITE sont des marques déposées de Dassault Systèmes ou de ses filiales aux USA et/ou dans d'autres pays.

Tout est possible… grâce aux univers virtuels 3DEXPERIENCE !
Avec 210 000 clients dans 12 secteurs industriels, du high-tech aux sciences de la vie, de la mode aux transports, Dassault Systèmes accompagne les entreprises et les créateurs à travers le monde pour imaginer les innovations durables d'aujourd'hui et de demain.

Rejoignez une entreprise leader et prospère de 15 000 talents.

Imaginez demain...

STAGE - Ingénieur(e) Recherche (H/F) - Deep Multi-Modal Retrieval

Les techniques basées sur l’apprentissage statistique (Deep Learning en particulier) sont très efficaces pour analyser des données complexes. Malheureusement, ces techniques nécessitent de grandes quantités de données annotées. Cette annotation est très coûteuse et nécessite beaucoup de travail manuel. De plus, plusieurs niveaux d’annotations sont nécessaires selon la complexité des données. Les annotateurs doivent avoir une grande expertise pluridisciplinaire.

L’annotation semi-supervisée est l’une des pistes privilégiées dans la recherche. Cette technique se base sur la collecte manuelle d'annotations localisées et d’outils automatiques de propagation de ces annotations vers les données non labélisées. De plus, la collecte d’annotations localisées nécessite l’étude de techniques efficaces pour la visualisation de données massives.

Rôle & Objectif

Le but de ce stage est de développer un prototype d’environnement d’annotation de données intégrant la visualisation des données (basée sur des techniques de réduction de dimension telles que la PCA ou le t-SNE), la collecte d’annotations locales et des algorithmes de type apprentissage semi-supervisé inductif et transductif scalable (Anchor based) afin de propager les annotations manuelles à de grandes quantités de données.

Dans un premier temps, vous devrez établir une recherche bibliographique sur le domaine et développer un prototype adapté aux données de Dassault Systèmes.

Sous la supervision de votre tuteur, vous devrez déterminer les outils de propagation à intégrer dans le prototype et les implémenter.

Enfin, la qualité des annotations sera évaluée sur des données synthétiques et réelles.

Profil H/F

Etudiant(e) en Ecole d'Ingénieurs ou Master universitaire, vous préparez un diplôme de niveau Bac+5 ou un Mastère spécialisé.

Vous vous spécialisez en Informatique, Apprentissage Statistique, Mathématiques Appliquées.

  • Pratique de la programmation Web et du Python
  • Connaissances en C++ souhaitées
  • Des bases en apprentissage statistique seront fortement appréciées
  • Bonne maitrise de l’anglais à l’oral et à l’écrit pour la rédaction de documentation
  • Curieux(se) et motivé(e)

Modlités :

6 mois maximum à partir de Février 2018.

Cette offre n'est plus disponible

Contact

Dassault Systèmes
Service Recrutement
10 Rue Marcel Dassault
78946 Vélizy
Logo Dassault Systèmes