Documentation — Notebooks
Objectif : Analyser, entraîner un dataset
1- Définition
Un notebook est un document en ligne qui combine du code exécutable (Python, R), du texte explicatif (Markdown), des visualisations et des résultats, dans un même fichier interactif.
2- Principe
Associer un notebook à un dataset
3- Objectifs
- - analyser et explorer des datasets
- - entraîner des modèles de machine learning / deep learning
- - visualiser des données (matplotlib, seaborn, plotly, etc.)
- - présenter un projet ou une recherche reproductible.
4- Structure d'un notebook
- - Introduction & Objectif (texte Markdown)
- - Importation des bibliothèques
- - Chargement des données
- - Exploration des données (EDA)
- - Préparation / Nettoyage
- - Modélisation & Entraînement
- - Évaluation du modèle
- - Visualisations
- - Conclusions ou pistes futures
5- Outils
7- Bonnes pratiques
- - Lorsque chatGPT vous propose de remplacer une partie du code, demandez-lui de vous fournir le code complet
- - Si vous avez des messages d'erreur dans votre notebook, communiquer-les à chatGPT
- - Utiliser avec votre notebook un échantillon de votre dataset si celui-ci contient plus de 5000 entrées - vous pouvez charger sur kaggle, un autre dataset qui est une partie de votre dataset final
Ressources
- exemples
En cliquant sur chaque exemple, vous avez les liens kaggle