Développement logiciel OCR scraping

Réf. MOTWSCRAP

Stage - Informatique - Développement

Localisation : Gironde

Début : dès que possible
Durée : de 1 à 4 mois
Indem. : selon profil

Master Of The Web

La société française Master Of The Web publie des sites web communautaires permettant la mise en relation de consommateurs avec les professionnels prestataires de services. L’expression citoyenne des consommateurs et l’échange sur un mode de gratuité sont au cœur des sites web développés par Master Of The Web.

Développement logiciel OCR scraping

Mission

La société est implantée à Bordeaux mais fonctionne actuellement en délocalisation avec des freelancers basés dans le monde entier.

Nous souhaitons développer un logiciel nous permettant ensuite de créer des petites applications d'OCR scraping (plus de détail sur notre besoin ci-dessous en anglais).

Le CDC est rédigé. Le développement est à débuter from scratch.

Compte tenu de l'organisation de notre société, le stage se déroulera en télétravail et en contact permanent via skype et les outils de télécommunications modernes.

+ de détails sur le projet :

We need to be able to build OCR scrapers which are able to :

  1. Automatically detect when predetermined softwares are running on a computer (examples of softwares we need to scrap : web browsers, or any software window like for example word, a media player, powerpoint, a gaming software or whatever...). It should be able to detect when this window is moved in the user's screen and follow it. Sometimes a window can temporarily hide or overlap the scanned window : our scraper must be able to deal with these situations and continue scanning even in this case. 
  2. When it has detected one of the predetermined software is running, it should automatically open one specific excel files to export the data.
  3. Do an OCR scan of this window in real time and when a predetermined event happens in the scanned window, launch an extraction of the data (in a timelapse faster than 1 second since the predetermined event happened)
  4. The data might be : text, numbers, OCR recognition of images, or simply the colour of predetermined pixels in the window.
  5. Extract the information and paste it into specific cells of an opened excel sheet (and maybe other outputs formats). 
  6. Call a macro in the excel output file after each pasting.
  7. Save a copy of each pasting in excel files stored in a determined directory (this action should not require to open excel when a new copy must be saved and stored, it should be done in the background). 
  8. Several scrapers should be able to work at the same time on the same computer. For example, a situation with 2 scrapers extracting data from a gaming software + 1 scraper extracting the subtitles from a movie on VLC at the same time should be possible.

So we need a solution allowing us to build such customed scrapers.

Profil

Nous recherchons un développeur compétent, autonome et dynamique.

Celui-ci devra être capable de mener un projet de développement de A à Z dans le language qu'il suggérera et que nous validerons ensemble.

Durée à définir. Notre besoin est de mener à bien ce projet dans les meilleurs délais.

Cette offre n'est plus disponible

Contact

Master Of The Web
Jeremie Leborgne
26 avenue Gustave Eiffel
33695 Mérignac

Nouvelle recherche