Topic outline


  • Le cours de sciences de données a comme objectif de vous familiariser avec quelques outils et concepts nécessaires pour analyser un ensemble de données et proposer des hypothèses et modèles à partir de ces données.

    Pour s'y faire nous allons utiliser quelques outils que vous pourriez trouver dans vos entreprises :

    • git et github desktop : Ces outils vous permettront de garder un historique du code et de le partager avec vos collègues et les formateurs.
    • Jupyter : Le langage utilisé dans le cours est Python. Toutes les activités seront déroulées dans des Notebooks Jupyter. 
    • des bibliothèques python : nous allons utiliser plusieurs bibliothèques Python pour l’analyse, la visualisation et la modélisation des données.


    Sur Caseine vous trouverez, en français, toutes les consignes à suivre et les compétences liées à chaque activité. Le code à produire sera hébergé en forme de Notebook Jupyter sur votre compte github.

    Dans cette section nous allons configurer notre environnement de travail, créer notre espace de code avec git, et publier notre code pour le partager avec les formateurs.

    Activité 1 : Utilisation de Git et Github Desktop

    Présentiel - 4h
    Vous allez commencer par installer git dans votre ordinateur et pratiquer les commandes les plus importants pour son utilisation.

    Avant de continuer
    Dans le développement logiciel il est indispensable de versionner ou historiser son code à fin de connaître ses évolutions et détecter les  possibles sources d'erreur.  Il est aussi nécessaire de partager son code pour faciliter le travail en équipe.

    Git est un outil qui permet, entre autre, d’effectuer ces tâches. Nous allons utiliser git tout au long du cours, il est donc important de connaître ses fonctionnalités de base.


    1. Installez Git sur votre machine

    • Si l'avez pas fait encore, créez un compte GitHub et vérifiez avec votre formateur que votre profil est bien rattaché à l'organisation Campus Numérique in the Alps.
    • Installez GitHub Desktop dans votre ordinateur, ouvrez-le et connectez-vous avec le compte github que vous venez de créer.
    • Prenez votre temps pour explorer l'outil.

    2. Créez votre premier repository git

    En git, un repository ou dépôt est un répertoire qui contient le code que nous voulons historiser.  Voyons comment nous pouvons créer un nouveau dépôt.

    • Dans GitHub Desktop, cliquez sur le bouton create new repository on your Hard Drive.
    • Dans le nom du dépôt mettez my-first-repository (le nom du dépôt ne doit pas contenir des accents, ni espaces, ni caractères spéciaux).
    • Dans description mettez This is my first git repository.
    • Sélectionnez le chemin local, dans votre disque dur, pour votre dépôt. Github Desktop va créer un répertoire avec le nom de votre dépôt dans le chemin sélectionné.
    • Activez l'option Initialize this repository with a README puis cliquez sur create repository.
    • Dans votre ordinateur, naviguez dans le répertoire que vous avez choisi pour votre dépôt et rentrez dans le répertoire my-first-repository. Vous devez trouvez un fichier README.md qui contient la description de votre dépôt.

    3. Publiez votre dépôt

    Maintenant nous allons partager le dépôt que nous venons de créer sur notre machine. Pour ça il faut le publier dans le serveur de GitHub

    • Dans GitHub Desktop, cliquez sur publish repository.
    • Laissez les options par défaut et cliquez sur publish repository.
    • Allez sur votre compte GitHub sur internet et vérifiez si votre dépôt a bien été publié.

    4. Modifiez votre dépôt et publiez les modifications

    • Ouvrez le fichier README.md dans un éditeur. Ajoutez à la fin du fichier une ligne de texte contenant votre Prénom et Nom.
    • Retournez sur GitHub Desktop et sélectionnez l'onglet changes, vous allez voir la ligne que vous venez de rajouter dans le fichier.
    • Pour "historiser" votre changement, en bas à gauche de la fenêtre, vous pouvez écrire un message, par exemple : Add my name to README file. En description vous pouvez donner plus d'information, par exemple : This is my first commit. Puis cliquez sur commit to master.
    • Maintenant vous pouvez publier les modifications : cliquez sur le bouton push origin qui se trouve au centre de la fenêtre de GitHub Desktop.
    • Pour finir, vérifiez que vos modifications sont publiées en allant sur la page de GitHub. 
     

    5. Récupérez le dépôt de travail

    Vous allez maintenant copier dans votre compte GitHub les énoncés sur lesquels nous allons travailler toute au long du cours. Il s’agit de Notebooks Jupyter que vous allez compléter.

    • Allez sur le dépôt du cours : https://github.com/le-campus-numerique/cours_SDD
    • Cliquez sur fork, et sélectionnez votre profile. L'action fork crée un copie du dépôt dans votre compte GitHub.
    • Revenez sur GitHub Desktop et cliquez sur file et puis clone repository.
    • Dans la liste de dépôts de GitHub sélectionnez le dépôt que vous venez de créer : cours_SDD sur votre profile.
    • Dans local path sélectionnez le chemin que vous désirez dans votre machine et cliquez sur clone. Vous avez copié dans votre machine le travail à compléter tout au long du cours.

    Activité 2 :  Introduction à Jupyter et publication d'un Notebook sur Git

    Présentiel - 4h

    1. Installez l’environnement de développement


    2. Complétez le Notebook iteration1/notebook0_hello_world.ipynb

    • Complétez la première partie du notebook : Hello World, mettez votre nom et prénom et exécutez
    • Publiez les modifications sur GitHub
    • Complétez la partie 2 du notebook : créez la fonction sum pour calculer la somme de 500 et 300
    • Publiez les modifications sur GitHub : cliquez sur push origin
    Une fois vous avez publié les modifications, vous pouvez valider la compétence : Installer et configurer votre environnement de travail et la compétence : Historiser votre code avec git et le publier