STAGE - Ingénieur Recherche - Leverage Data Patrimony (H/F)

Réf. 312445-21027948

Stage - Informatique - Développement

Localisation : Yvelines

Début : entre janvier et avril 2018
Durée : de 4 à 6 mois
Indem. : à définir

Dassault Systèmes

Dassault Systèmes, « The 3DEXPERIENCE Company », offre aux entreprises et aux particuliers les univers virtuels nécessaires à la conception d’innovations durables. Ses solutions leaders sur le marché transforment pour ses clients, la conception, la fabrication et la maintenance de leurs produits. Les solutions collaboratives de Dassault Systèmes permettent de promouvoir l’innovation sociale et offrent de nouvelles possibilités d’améliorer le monde  réel grâce aux univers virtuels. Avec des ventes dans 140 pays, le Groupe apporte de la valeur à près de 200 000 entreprises de toutes tailles dans toutes les industries.

CATIA, SOLIDWORKS, SIMULIA, DELMIA, ENOVIA, GEOVIA, EXALEAD, BIOVIA, NETVIBES, 3D VIA, 3DEXCITE sont des marques déposées de Dassault Systèmes ou de ses filiales aux USA et/ou dans d'autres pays.

Tout est possible… grâce aux univers virtuels 3DEXPERIENCE !
Avec 210 000 clients dans 12 secteurs industriels, du high-tech aux sciences de la vie, de la mode aux transports, Dassault Systèmes accompagne les entreprises et les créateurs à travers le monde pour imaginer les innovations durables d'aujourd'hui et de demain.
Rejoignez une entreprise leader et prospère de 15 000 talents.

STAGE - Ingénieur Recherche - Leverage Data Patrimony (H/F)

Présentation de l'équipe :

Le stage se déroulera dans l'équipe Data Science qui s'intéresse aux problématiques liées aux environnements de dimension massive mixant le réel et le virtuel et générant des quantités de données complexes nécessitant l'automatisation de leur traitement et de leur analyse afin d'en extraire une connaissance et des modèles à forte valeur ajoutée.

Grâce aux solutions de stockage de données « cloud », nous constatons une prolifération de contenus numériques hétérogènes.

Afin de naviguer dans ces contenus, iI devient nécessaire de développer des technologies d'analyse automatique.

Les techniques basées sur l'apprentissage statistique (Deep Learning en particulier) sont très efficaces pour analyser des données complexes. Malheureusement, ces techniques nécessitent de grandes quantités de données annotées.

Cette annotation est très couteuse et nécessite beaucoup de travail manuel.

De plus, plusieurs niveaux d'annotations sont nécessaires selon la complexité des données. Les annotateurs doivent avoir une grande expertise pluridisciplinaire.

L'annotation semi-supervisée est l'une des pistes privilégiées dans la recherche. Cette technique se base sur la collecte manuelle d'annotations localisées et d'outils automatiques de propagation de ces annotations vers les données non labélisées.

De plus, la collecte d'annotations localisées nécessite l'étude de techniques efficaces pour la visualisation de données massives.

Missions :

Le but de ce stage est de développer un prototype d'environnement d'annotation de données intégrant la visualisation des données (basée sur des techniques de réduction de dimension telles que la PCA ou le t-SNE), la collecte d'annotations locales et des algorithmes de type apprentissage semi-supervisé inductif et transductifs scalables (Anchor based) afin de propager les annotations manuelles à de grandes quantités de données.

  • Vous devrez dans un premier temps établir une recherche bibliographique sur le domaine et développer un prototype adapté aux données de Dassault Systèmes.
  • Sous la supervision de l'encadrant, vous devrez déterminer les outils de propagation à intégrer dans le prototype et les implémenter.
  • Enfin, la qualité des annotations sera évaluée sur des données synthétiques et réelles.

Profil H/F :

Etudiant(e) un diplôme de niveau BAC+5, Ecole d'ingénieurs ou Cycle Universitaire.

Spécialité(s)/ Option(s) souhaitée(s) : Informatique, Apprentissage Statistique, Mathématiques Appliquées

Compétences techniques souhaitées :

  • Pratique de la programmation Web et du Python
  • Connaissances en C++ souhaitées
  • Des bases en apprentissages statistique seront fortement appréciées
  • Bonne maitrise de l'anglais à l'oral et à l'écrit pour la rédaction de documentation

Qualités professionnelles souhaitées :

  • Vous êtes curieux(se) et motivé(e).
  • Rigoureux(se) et assidu(e) dans votre travail.
  • Vous avez un bon niveau d'anglais.

Type de contrat : Sous convention de stage obligatoire, d'une durée de 6 mois.

Contact

Dassault Systèmes
Service Recrutement
10 Rue Marcel Dassault
78946 Vélizy
Logo Dassault Systèmes

Nouvelle recherche