L'entreprise accompagnée et les missions: Externatic accompagne un groupe international spécialisé dans l’organisation de transports nationaux et internationaux de marchandises, présent sur plus de 80 sites en France et dans 160 pays. Fort d’un chiffre d’affaires proche du milliard d’euros et d’une croissance soutenue par des acquisitions stratégiques, ce groupe poursuit une ambitieuse trajectoire de développement. Au cœur de cette dynamique, la Direction Data joue un rôle clé dans la structuration et la valorisation des données au service des activités Supply Chain et logistiques. Rattaché(e) au Chief Data Officer, vous intégrez une équipe pluridisciplinaire composée de Data Engineers, Data Analysts et Data Stewards. Votre mission, concevoir et faire évoluer des pipelines de données robustes et des indicateurs stratégiques (descriptifs et prédictifs), afin d’optimiser la performance opérationnelle et décisionnelle du groupe. Au sein d’un environnement AWS structuré et industrialisé, vous intervenez sur l’ensemble du cycle de vie de la donnée : - Concevoir et faire évoluer des traitements AWS Glue (Python / PySpark) dans une logique de projets modulaires, librairies partagées et tests unitaires, en respectant les standards de qualité et les bonnes pratiques de développement. - Déployer et maintenir des pipelines de données batch, avec une perspective d’évolution vers des flux streaming, en garantissant performance, fiabilité et traçabilité. - Mettre en œuvre des pratiques DataOps / DevOps : gestion de versions, CI/CD, automatisation multi-environnements via l’Infrastructure as Code (CloudFormation, CDK, Terraform ou équivalent). - Structurer et optimiser le Data Lake / Data Warehouse : modélisation, partitionnement, gestion des formats, catalogage et gouvernance des données. - Industrialiser les processus d’ingestion, de transformation et de stockage sécurisé des données sensibles, dans le respect des exigences de qualité et de conformité. - Construire et mainte