Industrialisation de pipelines
Conception, developpement, tests, orchestration et livraison de flux batch ou streaming avec Spark, Kafka, Glue, Oozie, Jenkins, Ansible et GitLab CI.
Senior Data Engineer - Tech Lead Data - Nantes
J'accompagne les entreprises qui veulent fiabiliser leurs pipelines, migrer leurs plateformes Big Data, industrialiser leurs traitements Spark et remettre de la clarte dans des environnements data complexes.
Mon terrain naturel : les pipelines critiques, les migrations de plateformes, la qualite des donnees, les performances Spark et les chaines CI/CD qui evitent les deploiements fragiles.
Je peux intervenir comme Senior Data Engineer pour produire vite et proprement, ou comme Tech Lead Data pour cadrer l'architecture, animer l'equipe et fluidifier les echanges entre technique et metier.
Conception, developpement, tests, orchestration et livraison de flux batch ou streaming avec Spark, Kafka, Glue, Oozie, Jenkins, Ansible et GitLab CI.
Migration Teradata vers Azure Databricks, Hortonworks vers Cloudera, modernisation de traitements existants et accompagnement des equipes dans les nouveaux usages.
Optimisation Spark, partitionnement, cout/performance, observabilite, suivi de production, analyse d'incidents et amelioration de la tracabilite des donnees.
Cadrage technique, animation agile, documentation, formation d'equipes Big Data et coordination avec les metiers pour transformer les besoins en livrables exploitables.
Creation de traitements Spark/Scala sur AWS Glue, gestion des datasets sur S3, observabilite CloudWatch et maintien en conditions operationnelles de flux d'integration et de transformation.
Pilotage technique d'une migration data sur des indicateurs strategiques : comptabilite des ventes, fidelite, abonnements, affluence, CO2 et kilometres/passager. CI/CD avec Jenkins et Ansible.
Flux batch et streaming, migration Hortonworks vers Cloudera, workflows Oozie, supervision de production et accompagnement d'une equipe dans l'univers Big Data.
Mise en place d'une plateforme Hadoop, traitements Spark/Nifi/Java/Shell, datalab, dashboards et outils de generation et d'ingestion automatique de donnees structurees et non structurees.
Azure Databricks, Unity Catalog, ADLS Gen2, Delta Lake, AWS S3, Glue, CloudWatch, EMR
Spark Scala/Python/Java, Kafka, Hive, HDFS, Oozie, Nifi, Cloudera, Hortonworks, Semarchy XDI
GitLab CI, Jenkins, Ansible, XLRelease, Nexus, Artifactory, Datadog, Kibana, Grafana
Python, R, Tableau, Apache Superset, PostgreSQL, MySQL, Teradata, MongoDB, Cassandra
AWS, Spark/Scala, Glue, S3, CloudWatch, Semarchy XDI.
Migration Azure Databricks, Spark/Scala, CI/CD, Scrum Master.
Datalake bancaire, Kafka, Spark, Cloudera, Oozie, production.
Hadoop, Spark, Nifi, Java, Shell, datalab et dashboards.
Je suis base a Nantes et j'interviens sur des missions data engineering, cloud data platform, migration Big Data, leadership technique et mise en production.