Nouvelle recherche

STAGE - Big Data - Optimisation des performances d'une plateforme Hadoop (HF)

Dassault Systèmes

Stage - Informatique - Développement

Réf. 504878-27675580
Localisation
Yvelines
Début
entre janvier et mars 2019
Durée
6 mois
Indem.
à définir

Dassault Systèmes, « The 3DEXPERIENCE Company », offre aux entreprises et aux particuliers les univers virtuels nécessaires à la conception d'innovations durables. Ses solutions leaders sur le marché transforment pour ses clients, la conception, la fabrication et la maintenance de leurs produits. Les solutions collaboratives de Dassault Systèmes permettent de promouvoir l'innovation sociale et offrent de nouvelles possibilités d'améliorer le monde réel grâce aux univers virtuels. Avec des ventes dans plus de 140 pays, le Groupe apporte de la valeur à plus de 200 000 entreprises de toutes tailles dans 12 industries. 

CATIA, SOLIDWORKS, SIMULIA, DELMIA, ENOVIA, GEOVIA, EXALEAD, BIOVIA, NETVIBES, 3D VIA, 3DEXCITE sont des marques déposées de Dassault Systèmes ou de ses filiales aux USA et/ou dans d'autres pays.

Tout est possible… grâce aux univers virtuels 3DEXPERIENCE !
Avec 210 000 clients dans 12 secteurs industriels, du high-tech aux sciences de la vie, de la mode aux transports, Dassault Systèmes accompagne les entreprises et les créateurs à travers le monde pour imaginer les innovations durables d'aujourd'hui et de demain.

Rejoignez une entreprise leader et prospère de 15 000 talents.

Imaginez demain...

STAGE - Big Data - Optimisation des performances d’une plateforme Hadoop (HF)

Les enjeux liés aux technologiques Big Data ne sont plus à démontrer. Les scénarios sont de plus en plus complexes et en perpétuelle évolution.

Au sein du département Platform as A service (PaaS), vous intégrerez l'équipe Big Data - Usage Metering qui fournit une plateforme Hadoop scalable, fault-tolerant et de haute performance qui répond aux besoins Big Data et Analytics.

Vos futurs défis ...

Vous travaillerez sur des projets complexes et innovants.

Vous serez en charge de :

  • Comprendre et analyser les performances de la plateforme Hadoop.
  • Etudier la possibilité de monter en performance à travers l'ajout de nouveaux composants comme Tez, Hive LLAP, …
  • Analyser les requêtes des différents clients et proposer des best practices pour réduire les temps de réponse (hive partitioning/bucketing, étude des dags d'exécution, …).
  • Mettre en place des points de supervision afin de détecter toute régression au niveau des performances de la plateforme.
  • Proposer des solutions de long terme pour garantir des performances stables et indépendantes de l'augmentation de la volumétrie des données dans la plateforme.

Vos atouts pour réussir ...

Etudiant(e) préparant un diplôme de niveau BAC+5, Ecole d'ingénieur ou Master Universitaire.
Spécialité / Option souhaitée : Big Data

Compétences techniques souhaitées :

  • Vous connaissez les technologies de l'écosystème Hadoop (distribution Hortonworks ou Cloudera) comme HDFS, YARN, Hive, Spark, HBase Zeppelin, …
  • Vous connaissez bien un langage orienté objet (Java, C++, …) et un langage de script (Script shell, Python,..)
  • Vous maitrisez l'anglais à l'écrit comme à l'oral.

Qualités professionnelles souhaitées :

  • Rigueur, dynamisme et force de proposition

Type de contrat : sous convention de stage uniquement, d'une durée de 6 mois


(pdf, doc, docx, odt, odtx - Max : 5 Mo)
(pdf, doc, docx, odt, odtx - Max : 5 Mo)
En cliquant sur postuler, je crée mon profil iQuesta et j'accepte les conditions d'utilisation d'iQuesta.

Contact

Dassault Systèmes
Service Recrutement
10 Rue Marcel Dassault
78140 Vélizy-Villacoublay Cedex
Logo Dassault Systèmes