CERTNEXUS - CDSP
Certified Data Science Practitioner
Besoin d’adapter cette formation à vos besoins ?
N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure !
Formation créée le 25/03/2021. Dernière mise à jour le 06/07/2023.
Version du programme : 1
Programme de la formation
Pour qu'une entreprise prospère dans notre monde axé sur les données, elle doit traiter les données comme l'un de ses atouts les plus importants. Les données sont essentielles pour comprendre où se trouve l’entreprise et où elle se dirige. Cela nécessite une main-d'œuvre solide de professionnels capables d'analyser, de comprendre, de manipuler et de présenter des données au sein d'un cadre de processus efficace et reproductible. Ce cours vous permettra d'apporter de la valeur à l'entreprise en mettant des concepts de science des données en pratique. Ce cours comprend des activités pratiques pour chaque sujet.
Objectifs de la formation
- Utiliser les principes de la science des données pour résoudre les problèmes commerciaux
- Appliquer le processus d'extraction, de transformation et de chargement (ETL) pour préparer les ensembles de données
- Utiliser plusieurs techniques pour analyser les données et extraire des informations précieuses.
- Vous préparer à former des modèles d'apprentissage automatique.
- Former, régler et évaluer les modèles de classification.
- Former, régler et évaluer des modèles de régression et de prévision.
- Former, régler et évaluer les modèles de clustering.
- Finaliser un projet de science des données en présentant des modèles à un public, en les intégrant production et surveillance des performances du modèle
Profil des bénéficiaires
- Ce cours est conçu pour les professionnels qui exploitent les données pour résoudre des problèmes commerciaux. L'étudiant typique de ce cours aura plusieurs années d'expérience avec la technologie informatique, y compris une certaine aptitude en programmation informatique. Cependant, ce cours ne cible pas nécessairement un seul rôle organisationnel.
- L'étudiant peut être un programmeur cherchant à approfondir ses connaissances sur la façon d'orienter les décisions, la collecte, la lutte, l'analyse et la manipulation de données par le biais de code.
- Un analyste de données avec une formation en mathématiques appliquées et en statistiques qui souhaitent faire passer leurs compétences au niveau supérieur, ou dans un certain nombre d'autres situations basées sur les données.
- En fin de compte, l'étudiant cible est quelqu'un qui souhaite apprendre à extraire plus efficacement des informations de leur travail et de tirer parti de ces connaissances pour résoudre les problèmes commerciaux, apportant ainsi une plus grande valeur les affaires.
- Ce cours est également conçu pour aider les étudiants à se préparer à la science des données certifiée CertNexus® Certification de praticien (CDSP) (examen DSP-110)
- Pour assurer votre réussite dans ce cours, vous devez avoir au moins une compréhension de haut niveau des concepts de science des données, y compris, mais sans s'y limiter: les types de données, les rôles de la science des données, les données globales cycle de vie de la science, et les avantages et les défis de la science des données.
- Vous pouvez obtenir ce niveau de connaissance en suivant le cours CertNexus DSBIZ ™ (examen DSZ-110).
- Vous devez également avoir une expérience de travail avec des bases de données, des langages d'interrogation comme SQL et de haut niveau langages de programmation comme Python.
- Vous pouvez obtenir ce niveau de compétences et de connaissances en suivant le suivant les cours d'opérations logiques : • Conception de bases de données: une approche moderne • Requête SQL : principes de base (deuxième édition) • Requête SQL : avancée (deuxième édition) • Introduction à la programmation avec Python • Techniques de programmation avancées avec Python • Utilisation des outils de science des données en Python
Contenu de la formation
-
Résoudre les problèmes commerciaux avec la science des données
- Lancer un projet de science des données
- Formuler un problème de science des données
-
Extraction, transformation et chargement de données
- Extraire des données
- Transformer les données
- Charger des données
-
Analyse des données
- Examiner les données
- Explorer la distribution sous-jacente des données
- Utiliser les visualisations pour analyser les données
- Prétraiter les données
-
Préparation à la formation d'un modèle d'apprentissage automatique
- Identifier les concepts d'apprentissage automatique
- Tester une hypothèse
-
Développement de modèles de classification
- Modèles de classification Train et Tune
- Évaluer les modèles de classification
-
Développement de modèles de régression et de prévision
- Former et régler les modèles de régression et de prévision
- Évaluer les modèles de régression et de prévision
-
Développement de modèles de clustering
- Former et régler les modèles de clustering
- Évaluer les modèles de clustering
-
Finaliser un projet de science des données
- Communiquer les résultats aux parties prenantes
- Démonstration d'un modèle dans une application Web
- Implémentation et test des pipelines de production
-
Annexe A: Mappage du contenu du cours sur CertNexus® Certified Data Science Practitioner (CDSP) (examen DSP-110)
- Feuilles de présence.
- Questions orales ou écrites (QCM).
- Mises en situation.
- Formulaires d'évaluation de la formation.
- Accueil des stagiaires dans une salle dédiée à la formation ou espace Webex dédiée en classe à distance.
- Documents supports de formation projetés en anglais
- Exposés théoriques
- Etude de cas concrets
- Quiz
Modalités de certification
- Ce cours prépare à l'examen DSP-110
- L'examen certifiera que le candidat retenu possède les connaissances, les compétences et les aptitudes requises pour répondre à des questions en collectant, traitant et explorant des ensembles de données, en appliquant des modèles statistiques et des algorithmes d'intelligence artificielle, afin d'extraire et de communiquer des connaissances et des idées.