teach.pascalyim.com

Ressources

Documents, notebooks, datasets et guides à télécharger.

Datasets

Mini datasets — utilisés dans les chapitres ML 1 à 3

  • titanic_mini.csv· 7 KB

    Survie au Titanic — variables : Sex, Age, FirstClass, Children, Survived. Classification binaire pour ML-3.

    Télécharger
  • abalone_mini.csv· 103 KB

    Ormeaux : prédire l'âge (Rings) à partir de mesures physiques (Length, Diameter, Height, Weight). Régression.

    Télécharger
  • cancer_mini.csv· 15 KB

    Cancer du sein Wisconsin (UCI). Variables radiologiques + diagnostic (M/B → 0/1). Utilisé en ML-3.

    Télécharger
  • house_mini.csv· 753 KB

    Prix de maisons (régression sur surface, nombre de pièces, etc.). Utilisé en ML-2.

    Télécharger
  • co2_mini.csv· 28 KB

    Concentration de CO2 atmosphérique au cours du temps. Régression / série temporelle.

    Télécharger
  • cos_mini.csv· 4 KB

    Données synthétiques cosinus pour illustrer la régression non-linéaire / polynomiale.

    Télécharger
  • iris_mini.csv· 1 KB

    Le classique Iris (sepal/petal length/width → species). Pour démarrer la classification.

    Télécharger
  • passengers_mini.csv· 1 KB

    Passagers d'avion par mois, série temporelle classique pour ML-1.

    Télécharger

Datasets classiques — chapitres ML 4 et exercices

  • penguins.csv· 14 KB

    Penguins de Palmer (3 espèces, mesures bec/aile). Substitut moderne d'Iris.

    Télécharger
  • mushrooms.csv· 366 KB

    UCI Mushroom (8 124 champignons). Classification binaire comestible / toxique uniquement à partir de descripteurs morphologiques.

    Télécharger
  • student.csv· 67 KB

    UCI Student Performance (notes maths/portugais, contexte familial). Régression ou classification multiclasse.

    Télécharger
  • creditcard.csv· 42 MB

    Détection de fraude carte bancaire (très déséquilibré, ~0.17 % de fraudes). Bench typique pour la classe minoritaire.

    Télécharger
  • titanic.csv· 60 KB

    Titanic complet (Kaggle), avec plus de variables que titanic_mini : Name, Ticket, Cabin, Fare, Embarked, …

    Télécharger
  • cancer.csv· 123 KB

    Wisconsin Breast Cancer complet (30 features). Plus large que cancer_mini.

    Télécharger
  • churn.csv· 274 KB

    Churn télécom : prédiction de la résiliation des clients à partir de leur profil et usage.

    Télécharger
  • stars.csv· 8 KB

    Classification d'étoiles (température, luminosité, rayon → type spectral). Multiclasse, jeu pédagogique.

    Télécharger
  • adult.csv· 4 MB

    UCI Adult / Census Income. Prédire si revenu > 50 K$/an (classification binaire avec biais à analyser).

    Télécharger

Datasets d'exercices — pour ML 5 (gros volumes)

  • house_prices.csv· 450 KB

    Kaggle Ames Housing — régression complexe sur ~80 features, prix de maisons à Ames (Iowa). Pour ML-5.

    Télécharger
  • mercedes_test.csv· 6.2 MB

    Kaggle Mercedes-Benz Greener Manufacturing : prédiction de durée de tests sur véhicules. Régression industrielle.

    Télécharger
  • stroke.csv· 2.6 MB

    Prédiction d'AVC à partir de variables médicales et démographiques. Classification binaire déséquilibrée.

    Télécharger
  • mnist.csv· 122 MB

    MNIST en CSV (70 000 chiffres manuscrits 28×28 px, label 0-9). Classification multiclasse, à exécuter en local de préférence.

    Télécharger
  • sign.csv· 101 MB

    Sign Language MNIST : alphabet de la langue des signes en images 28×28 pixels.

    Télécharger

Notebooks du cours

  • DL-1DL1 - neurone lineaire
    dl1-ecpk-pascal-yim.ipynb · 1081 KB · 5/13/2026
    Télécharger
  • DL-2DL2 - classification
    dl-2-ecpk-py (3).ipynb · 555 KB · 5/14/2026
    Télécharger
  • DL-3DL3 - Convolutions 1
    dl3-ecpk-pascal-yim.ipynb · 597 KB · 5/14/2026
    Télécharger
  • DL-4DL4 - Convolution 2
    dl4-ecpk-py.ipynb · 526 KB · 5/15/2026
    Télécharger
  • ML-1ML1 : rappels
    ml1-ecpk-pascal-yim.ipynb · 329 KB · 5/11/2026
    Télécharger
  • ML-2ML2 : regression
    ml2-ecpk-pascal-yim.ipynb · 1040 KB · 5/11/2026
    Télécharger
  • ML-3ML3 : Classification
    ml3-ecpk-pascal-yim.ipynb · 61 KB · 5/11/2026
    Télécharger
  • ML-4ML4 : datas
    ml4-ecpk-pascal-yim.ipynb · 90 KB · 5/11/2026
    Télécharger

Datasets supplémentaires

  • Dataset alien vs predator
    archive (3).zip · 14476 KB · 5/15/2026
    Télécharger