IA - Penninghen

Datasets
DatasetsNotebooksKaggleModèlesglossaireliens utiles
Cours
edit

IA - Penninghen

Documentation — glossaire

Dataset :
un ensemble de données organisé (images, textes, chiffres…) utilisé pour entraîner ou tester un modèle.

Notebook :
un document interactif (souvent en Python) qui mélange texte et code exécutable pour tester pas à pas et visualiser immédiatement les résultats (tableaux, graphiques, images).

Modèle :
un programme qui apprend à partir d’un dataset pour prédire ou analyser de nouvelles données.

Entraînement :
la phase où le modèle “apprend” en cherchant des régularités dans les données (il ajuste ses paramètres).

Prédiction :
l’utilisation du modèle entraîné pour analyser ou deviner le résultat sur de nouvelles données.

Matrice de confusion :
Une matrice de confusion compare les prédictions du modèle avec les vraies réponses.
Les bons résultats apparaissent sur la diagonale (prédiction correcte).
Les erreurs (hors diagonale) indiquent où le modèle se trompe → cela peut révéler ce qui manque ou est mal représenté dans le dataset (ex. trop peu d’exemples d’une classe).
En bref : les erreurs montrent les faiblesses du dataset et guident son amélioration.