En tant que Data Engineer chez Leakmited, vous jouerez un rôle clé dans la construction et la maintenance des fondations data qui alimentent nos produits basés sur l’IA et la donnée.
Vous concevrez, développerez et opérerez des pipelines de données robustes sur AWS et Databricks, en garantissant un haut niveau de qualité, de fiabilité et d’observabilité sur l’ensemble du cycle de vie des données.
Vous évoluerez dans un environnement fortement transverse, en collaboration étroite avec les équipes software, data science, opérations et commerciales. Ce rôle s’adresse à une personne curieuse des enjeux business, aimant le développement hands-on et souhaitant construire des systèmes data à fort impact, directement liés aux décisions produit et opérationnelles.
Notre stack technique:
Python, Geopandas, Unity Catalog, Databricks, SQL, PostgreSQL / PostGIS, DBT, GitHub, GitHub Actions, AWS, MLflow, Spark, LangChain / LangGraph / LangSmith.
Vos responsabilités:
- Collaborer au sein d’équipes projets transverses avec des data scientists, développeurs et product owners afin d’intégrer les pipelines de données dans des architectures de production
- Concevoir, développer et maintenir des pipelines de données et des processus ETL scalables et fiables sur AWS et Databricks
- Accompagner les data scientists dans le déploiement performant des modèles de machine learning
- Participer à des boucles de feedback continues afin d’améliorer les produits data en fonction de leur usage réel et de leurs performances
- Contribuer à l’évolution de l’architecture data de Leakmited, avec un focus sur la robustesse, la scalabilité et la maintenabilitéGarantir la qualité des données, leur observabilité et leur monitoring, afin de permettre des décisions fiables et des itérations rapides
- Travailler en étroite collaboration avec les équipes opérationnelles et business pour comprendre les cas d’usage, traduire les besoins en solutions data et les déployer
- Votre profil:3+ ans d’expérience professionnelle en tant que Lead Data Engineer ou dans un rôle similaire avec une forte dimension hands-on
- Solide expérience dans la conception et le développement d’architectures data en production, avec une forte culture d’ingénierie logicielle
- Capacité démontrée à être un contributeur clé, en prenant en charge les architectures et leur implémentation de bout en bout
- Expérience avec AWS et Databricks pour le traitement et l’analyse de données
- Excellentes compétences en Python et SQL, avec de bonnes bases en développement logiciel
- Expérience pratique en qualité des données, observabilité et monitoring en environnement de production
- Forte orientation business : capacité à prioriser l’impact et éviter de construire de la “tech pour la tech”À l’aise dans des environnements transverses (engineering, opérations, sales)
- Esprit curieux, pragmatique et collaboratif
- Diplôme de niveau Bachelor ou Master en informatique, ingénierie logicielle, data science, systèmes d’information ou domaine technique équivalent (un plus)
- Nice to have:
- Expérience avec des données géospatiales (GIS) et/ou des séries temporelles
- Expérience préalable en startup ou scale-up
- Connaissance des workflows ML / IA et des boucles de feedback en production Préqualification avec le recruteur
- Entretien avec le Head of DataÉvaluation technique
- Rencontre sur site avec l’équipe
- Entretien RHPrésentation de l’offre