Data Engineer

  • Full Time
  • Paris
  • Posted 1 month ago

La société

Notre client est le leader de l’onboarding digital pour les services financiers en France et en

Europe (ouverture de comptes bancaires en ligne, souscription d’assurance en ligne…). Solution: une plateforme SaaS proposant des produits de KYC (Know Your Customer), de gestion automatique de documents basée sur l’intelligence artificielle, de signature électronique, et de Business Intelligence.

Clients : HSBC, American Express, Boursorama, Crédit Agricole, Orange Bank, ING,

Fortuneo, Axa banque, Generali, Carrefour Banque…

Le contexte business : 30-40% de croissance par an depuis maintenant 4 ans.

Ils  sont dans une phase d’industrialisation de leurs produits et de développement international fort (15 pays en Europe).

L’équipe et ses missions

Des dizaines de milliers de comptes sont ouverts via la plateforme chaque jour. Le Tech Lead Python travaillera au sein de l’équipe Data, dont le but principal est de valoriser ce grand volume de données entrantes (dossiers, pièces justificatives, logs…). L’équipe est aujourd’hui composée de 4 Data Scientists, 3 Data Engineers 2 Développeurs Python 1 Architecte Data

(Elle couvre des thématiques larges telles que :

  • Vision artificielle : lecture et reconnaissance automatique de documents structurés ou non structurés (OCR), classification, analyse sémantique (NLP)
  • Business Intelligence (BI) : ETLs permettant de produire des métriques métier à destinations des autres équipes ou des clients
  • Facturation : calculs de facturation pour l’ensemble des produits

Rendre les processus de déploiement plus robustes, industrialiser les solutions, concevoir des outils rendant les projets de l’équipe plus rapide à livrer en production ou encore normer les métriques loguées dans tous les projets sont donc des enjeux essentiels au sein de l’équipe.

Descriptif du poste

L’entreprise s’engage en ce moment dans un travail de refonte technologique de sa plateforme historique. Dans ce contexte, l’équipe Data va être amenée à prendre un rôle plus central dans la génération de données anonymisées utilisées dans le cadre d’analyses de BI. La mission principale du poste sera de participer pleinement à cet effort, tant dans la définition des solutions retenues par l’architecte que dans leur implémentation, et ensuite dans leur évolution.

  • Technologies de Big Data : Hadoop/Spark pressenti, développements associés, création des transformations des données, des API permettant de requêter ces données. Création et orchestration de nos ETL

Profil recherché

Nous recherchons un.e candidat.e avec une première expérience de Data Engineer en Python (3 ans) ayant travaillé sur des projets en production (tests, logs, versionning…).

Compétences requises :

  • Python 3
  • Docker
  • Git

Et appréciées :

  • Technologies de big data : Hadoop, Spark…
  • Gestionnaire de workflow : AirFlow, Prefect…
  • Minio, Vault
  • Kafka
  • Outil de versionning général d’environnement (ex: poetry)
  • Outil de monitoring (sentry, Kibana…)
  • Ansible

Environnement technique actuel

  • Python 3 / Docker / Gitlab / Ansible
  • Pandas / Bonobo / Prefect

MongoDB

Upload your cover letter or any other relevant file(s). Max. file size: 128 MB.
Upload your CV/resume or any other relevant file(s). Max. file size: 128 MB.

Job Overview
Job Location

Want access to all our latest jobs, news and team updates?

Sign up to our newsletter!
Your subscription could not be saved. Please try again.
Your subscription has been successful.