Text copied to clipboard!

Titre

Text copied to clipboard!

Développeur de pipelines de données

Description

Text copied to clipboard!
Nous recherchons un Développeur de pipelines de données capable de concevoir, développer, déployer et maintenir des flux de données robustes au service des besoins analytiques et opérationnels de l’entreprise. Ce poste s’adresse à une personne passionnée par l’ingénierie des données, la qualité des traitements, l’automatisation et la performance des plateformes modernes. Le candidat idéal sait transformer des sources de données hétérogènes en pipelines fiables, sécurisés et évolutifs, tout en collaborant étroitement avec les équipes produit, analytique, infrastructure et développement logiciel. Dans ce rôle, vous interviendrez sur l’ensemble du cycle de vie des pipelines de données, depuis l’analyse des besoins métiers jusqu’à la mise en production et au suivi continu. Vous participerez à la collecte, à l’intégration, à la transformation et à l’orchestration des données provenant de systèmes variés tels que bases relationnelles, API, applications cloud, fichiers plats, événements temps réel ou plateformes SaaS. Vous contribuerez également à la structuration des données pour favoriser leur exploitation par les analystes, les data scientists et les équipes décisionnelles. Le poste exige une solide compréhension des architectures de données modernes, des principes ETL et ELT, ainsi qu’une bonne maîtrise des environnements cloud et des outils d’orchestration. Vous devrez mettre en place des mécanismes de contrôle qualité, de supervision, de journalisation et d’alerte afin de garantir la disponibilité et l’intégrité des données. Une attention particulière sera portée à la documentation, à la maintenabilité du code et au respect des bonnes pratiques de sécurité et de gouvernance. Au quotidien, vous travaillerez sur l’optimisation des performances, la réduction des temps de traitement, la gestion des dépendances entre flux et l’amélioration continue des processus existants. Vous serez amené à résoudre des incidents complexes, à analyser les causes racines des anomalies et à proposer des solutions durables. Vous participerez aussi à la définition des standards techniques, à la revue de code et à l’industrialisation des déploiements via des pratiques DevOps et CI/CD. Nous recherchons une personne rigoureuse, curieuse et orientée solution, capable de communiquer clairement avec des interlocuteurs techniques et non techniques. Une expérience dans la modélisation des données, l’intégration de grands volumes d’information et la gestion de pipelines critiques sera fortement appréciée. Ce poste offre l’opportunité de jouer un rôle central dans la valorisation des données de l’organisation, en construisant des fondations techniques fiables qui soutiennent l’innovation, la prise de décision et la croissance à long terme.

Responsabilités

Text copied to clipboard!
  • Concevoir et développer des pipelines de données batch et temps réel.
  • Intégrer des données provenant de bases de données, API et services cloud.
  • Mettre en place des processus ETL et ELT fiables et automatisés.
  • Surveiller la qualité, la disponibilité et la performance des flux de données.
  • Optimiser les traitements pour améliorer les temps d’exécution et les coûts.
  • Collaborer avec les analystes, data scientists et équipes produit.
  • Documenter les architectures, transformations et dépendances des pipelines.
  • Appliquer les bonnes pratiques de sécurité, gouvernance et conformité des données.

Exigences

Text copied to clipboard!
  • Expérience en développement de pipelines de données en environnement de production.
  • Maîtrise de SQL et d’au moins un langage comme Python, Java ou Scala.
  • Connaissance des concepts ETL, ELT et orchestration de workflows.
  • Expérience avec des plateformes cloud comme AWS, Azure ou Google Cloud.
  • Compréhension des bases de données relationnelles et non relationnelles.
  • Capacité à gérer la qualité, la validation et le monitoring des données.
  • Connaissance des outils de versioning, CI/CD et automatisation.
  • Bonnes compétences en résolution de problèmes et en communication technique.

Questions potentielles d'entretien

Text copied to clipboard!
  • Quelle expérience avez-vous dans la création de pipelines de données en production ?
  • Quels outils d’orchestration de données avez-vous déjà utilisés ?
  • Comment assurez-vous la qualité et la fiabilité des données traitées ?
  • Avez-vous travaillé avec des architectures cloud pour l’ingénierie des données ?
  • Quelle est votre maîtrise de SQL et de Python dans des projets réels ?
  • Comment gérez-vous les incidents ou échecs dans un pipeline critique ?