Bâtir votre pipeline de Data (Science)
Les modèles sont sans cesse améliorés, la data de plus en plus accessible, mais il faut savoir l'orchestrer, la nettoyer et la rendre la plus temps-réel possible.
Les priorités d'hier ne sont pas celle de demain, il faut constamment les réévaluer pour maximiser la valeur métier. Et savoir quels outils choisir pour garantir cette flexibilité.
Le data engineering est un métier d'expertise et de passion. Le ML engineering implique en outre une vraie compréhension des besoins des datas scientist.
Le ML engineer a idéalement des fondamentaux en data engineering, il sait structurer les flux de données, à la juste fréquence, et en quantités nécessaires et suffisantes aux besoins.
Le ML engineer comprends les fondamentaux des principaux modèles de data science pour savoir interagir avec ses pairs dans le domaine.
Le ML engineer comprend les besoins d'un modèle en production. Evolution, stabilité, temps de réponse, compatibilités sont ces préoccupations principales.
ML engineer/ML OPs/Data Engineer, nous savons que la Data Science n'est pas "hors-sol" et doit être accompagnée des bons relais pour sa mise en production.
Ce profil, très prisé des entreprises, est encore peu disponible en CDI ou freelance. Pour des besoins de formation intra/inter entreprises, pour de la formation en école, les membres de SapIA vous accompagnent en présentiel ou en distanciel, dans des formats adaptés à vos besoins.
Comprendre l'histoire du secteur, les enjeux, les acteurs, les outils et les perspectives.
Prises brutes, les données sont dispersées, hétérogènes, incomplètes et donc inexploitables. Découverte des stratégies et outils pour permettre leur exploitation.
Pour comprendre quand utiliser la data science, engineering, analytics/visualisation, les atouts et les limites sur des cas concrets
Développer des premiers reflexes sur ce langage qui se trouve au cœur des outils de données.
Si vous n'avez pas un passé de data scientist, ce module vous permet de comprendre les principaux outils du ML/DL (TensorFlow, Pandas, Numpy...)et de faire quelques petites réalisations.
Ce module vous permet de comprendre les principaux outils du data engineer (Hadoop, Spark, Cloud, Talend, Airflow...) et de faire des premières réalisations.
Sur base notamment d'AWS Sagemaker, vous mettez en place une infrastructure capable de supporter les besoins d'une équipe de data scientists.