This job posting is available in French only due to the location of publication.
Votre rôle, votre impact
À titre de spécialiste principal ou spécialiste principale Databricks, rejoignez notre équipe de données pour livrer des solutions d’ingénierie de données à fort impact dans le cadre de mandats clients d’envergure. Vous concevrez et mettrez en œuvre des plateformes de données prêtes pour la production sur Databricks pour les secteurs de la finance, de l’industrie, de l’énergie, des télécommunications, de la santé ainsi que du secteur public.
Dans ce rôle, vous contribuerez à la croissance accélérée que procure le travail dans des environnements et des industries variés grâce à votre profondeur technique et vos excellentes compétences en communication et en ingénierie.
Votre quotidien
Concevoir et optimiser des pipelines de données en production sur Databricks à l’aide de PySpark, Delta Lake et SQL;
Mettre en œuvre des architectures lakehouse de type Medallion (Bronze / Silver / Gold) adaptées à la stratégie de chaque client;
Orchestrer les pipelines avec Databricks Workflows, Azure Data Factory ou Apache Airflow;
Intégrer MLflow pour le suivi des expérimentations, le versionnement des modèles et leur déploiement dans des environnements intégrant le machine learning;
Appliquer les meilleures pratiques en matière de gouvernance et de sécurité des données à l’aide de Unity Catalog, de l’IAM et du RBAC dans des environnements infonuagiques;
Mettre en place des cadres de qualité des données (p. ex. Great Expectations) afin d’assurer la fiabilité des livrables destinés aux clients;
Collaborer directement avec les clients pour recueillir les besoins, définir les responsabilités et vulgariser les décisions techniques auprès d’interlocuteurs non techniques;
Produire une documentation technique claire et assurer le transfert de connaissances aux clients.
Contribuer aux discussions d’architecture de solution et, au besoin, appuyer les activités de prévente, y compris l’estimation des efforts et la rédaction de propositions;
Encadrer les membres juniors de l’équipe et partager votre expertise au sein de la communauté de pratique en données d’Alithya.
Les clés de votre réussite
Plus de 5 ans d’expérience concrète avec Databricks dans des environnements de production;
Solide maîtrise de Python, PySpark et SQL pour la transformation des données et le développement de pipelines;
Compréhension approfondie de Delta Lake et des principes d’architecture lakehouse;
Expérience sur au moins une plateforme infonuagique majeure : Microsoft Azure (préféré), AWS ou GCP;
Capacité démontrée à vulgariser des concepts techniques complexes auprès de parties prenantes d’affaires;
Capacité de travailler de manière autonome dans de nouveaux environnements clients et de s’adapter rapidement à des technologies et des structures d’équipe inconnues.
Vos atouts supplémentaires
Certification Databricks (Data Engineer Associate, Professional ou ML Professional);
Expérience avec Apache Kafka ou d’autres frameworks d’ingestion de données en continu;
Familiarité avec dbt, Terraform (IaC) ou les pipelines CI/CD appliqués aux données (DataOps);
Connaissances de MLflow, des pratiques MLOps ou de l’intégration de plateformes d’IA/ML;
Expérience avec des outils de qualité et d’observabilité des données (Great Expectations, Monte Carlo, Soda);
Maîtrise de Scala pour le développement natif avec Spark;
Expérience préalable en environnement de consultation ou dans un contexte multi-clients.
Compétences linguistiques
Français : Maîtrisé
Anglais : Intermédiaire
Veuillez noter qu’un anglais de niveau intermédiaire est requis en raison de la nature des tâches, notamment pour communiquer de manière fréquente avec la clientèle hors du Québec.
Connectez-vous pour consulter des avis authentiques, des évaluations anonymes et des données salariales avant de postuler.