Le Machine Learning/Data Engineer ("ML Ops")

Bâtir votre pipeline de Data (Science)

Des re-engineering incessants ?

Les modèles sont sans cesse améliorés, la data de plus en plus accessible, mais il faut savoir l'orchestrer, la nettoyer et la rendre la plus temps-réel possible.

Décalés par rapport aux métiers ?

Les priorités d'hier ne sont pas celle de demain, il faut constamment les réévaluer pour maximiser la valeur métier. Et savoir quels outils choisir pour garantir cette flexibilité.

Un sujet laissé pour compte ?

Le data engineering est un métier d'expertise et de passion. Le ML engineering implique en outre une vraie compréhension des besoins des datas scientist.

Un ML engineer assure ...

Un pipeline de données pertinentes

Le ML engineer a idéalement des fondamentaux en data engineering, il sait structurer les flux de données, à la juste fréquence, et en quantités nécessaires et suffisantes aux besoins.

Une compréhension des besoins de la Data Science

Le ML engineer comprends les fondamentaux des principaux modèles de data science pour savoir interagir avec ses pairs dans le domaine.

Une industrialisation solide

Le ML engineer comprend les besoins d'un modèle en production. Evolution, stabilité, temps de réponse, compatibilités sont ces préoccupations principales.

SapIA vous assiste sur ces métiers :

ML engineer/ML OPs/Data Engineer, nous savons que la Data Science n'est pas "hors-sol" et doit être accompagnée des bons relais pour sa mise en production.

Notre formation ML engineer/Ops

Ce profil, très prisé des entreprises, est encore peu disponible en CDI ou freelance. Pour des besoins de formation intra/inter entreprises, pour de la formation en école, les membres de SapIA vous accompagnent en présentiel ou en distanciel, dans des formats adaptés à vos besoins.

Efficacité
Experts métiers
"Real-life exercises over theory"

Syllabus ML Engineer/Ops - 21 à 72 heures (suivant options)

L'ecosystème, les métiers, les outils (2h)

Comprendre l'histoire du secteur, les enjeux, les acteurs, les outils et les perspectives.

Architecture de données, gouvernance (4h)

Prises brutes, les données sont dispersées, hétérogènes, incomplètes et donc inexploitables. Découverte des stratégies et outils pour permettre leur exploitation.

SQL avancé (option) (20h)

Pour comprendre quand utiliser la data science, engineering, analytics/visualisation, les atouts et les limites sur des cas concrets

Python (option) (8h)

Développer des premiers reflexes sur ce langage qui se trouve au cœur des outils de données.

Techniques data science (option) (8h)

Si vous n'avez pas un passé de data scientist, ce module vous permet de comprendre les principaux outils du ML/DL (TensorFlow, Pandas, Numpy...)et de faire quelques petites réalisations.

Outils de data engineering (option) (15h)

Ce module vous permet de comprendre les principaux outils du data engineer (Hadoop, Spark, Cloud, Talend, Airflow...) et de faire des premières réalisations.

Les outils du ML engineer/Ops (15h)

Sur base notamment d'AWS Sagemaker, vous mettez en place une infrastructure capable de supporter les besoins d'une équipe de data scientists.