teach.pascalyim.com

资源

可下载的文档、notebooks、数据集和指南。

数据集

Mini数据集 — 用于ML 1-3章

  • titanic_mini.csv· 7 KB

    泰坦尼克生存预测 — 特征: Sex, Age, FirstClass, Children, Survived。ML-3的二分类。

    下载
  • abalone_mini.csv· 103 KB

    鲍鱼数据集:通过物理测量(Length, Diameter, Height, Weight)预测年龄(Rings)。回归任务。

    下载
  • cancer_mini.csv· 15 KB

    威斯康辛乳腺癌(UCI)。放射学特征 + 诊断(M/B → 0/1)。用于ML-3。

    下载
  • house_mini.csv· 753 KB

    房价数据(基于面积、房间数等的回归)。用于ML-2。

    下载
  • co2_mini.csv· 28 KB

    大气CO2浓度随时间变化。回归/时间序列。

    下载
  • cos_mini.csv· 4 KB

    合成余弦数据,用于说明非线性/多项式回归。

    下载
  • iris_mini.csv· 1 KB

    经典鸢尾花数据集(sepal/petal length/width → species)。入门分类。

    下载
  • passengers_mini.csv· 1 KB

    航空公司每月乘客量,ML-1的经典时间序列。

    下载

经典数据集 — ML 4章和练习

  • penguins.csv· 14 KB

    Palmer企鹅数据(3个物种,喙/翅膀测量)。Iris的现代替代品。

    下载
  • mushrooms.csv· 366 KB

    UCI蘑菇数据(8124个样本)。仅根据形态描述符进行可食用/有毒二分类。

    下载
  • student.csv· 67 KB

    UCI学生成绩(数学/葡萄牙语成绩,家庭背景)。回归或多分类。

    下载
  • creditcard.csv· 42 MB

    信用卡欺诈检测(严重不平衡,~0.17%欺诈)。少数类问题的经典基准。

    下载
  • titanic.csv· 60 KB

    完整泰坦尼克数据(Kaggle),比titanic_mini更多特征:Name, Ticket, Cabin, Fare, Embarked等。

    下载
  • cancer.csv· 123 KB

    完整威斯康辛乳腺癌(30个特征)。比cancer_mini更宽。

    下载
  • churn.csv· 274 KB

    电信客户流失:根据用户档案和使用情况预测客户流失。

    下载
  • stars.csv· 8 KB

    恒星分类(温度、光度、半径 → 光谱类型)。多分类,教学用。

    下载
  • adult.csv· 4 MB

    UCI Adult / Census Income。预测收入是否>50K美元/年(二分类,需分析偏差)。

    下载

练习数据集 — 用于ML 5(大体积)

  • house_prices.csv· 450 KB

    Kaggle Ames房价 — 80个特征的复杂回归,Ames(Iowa)的房价。用于ML-5。

    下载
  • mercedes_test.csv· 6.2 MB

    Kaggle奔驰绿色制造:预测车辆测试时间。工业回归。

    下载
  • stroke.csv· 2.6 MB

    根据医学和人口统计变量预测中风。不平衡二分类。

    下载
  • mnist.csv· 122 MB

    MNIST CSV格式(70000个28×28手写数字,标签0-9)。多分类,建议本地执行。

    下载
  • sign.csv· 101 MB

    手语MNIST:28×28像素的手语字母图像。

    下载

课程笔记本

  • DL-1DL1 - neurone lineaire
    dl1-ecpk-pascal-yim.ipynb · 1081 KB · 5/13/2026
    下载
  • DL-2DL2 - classification
    dl-2-ecpk-py (3).ipynb · 555 KB · 5/14/2026
    下载
  • DL-3DL3 - Convolutions 1
    dl3-ecpk-pascal-yim.ipynb · 597 KB · 5/14/2026
    下载
  • DL-4DL4 - Convolution 2
    dl4-ecpk-py.ipynb · 526 KB · 5/15/2026
    下载
  • ML-1ML1 : rappels
    ml1-ecpk-pascal-yim.ipynb · 329 KB · 5/11/2026
    下载
  • ML-2ML2 : regression
    ml2-ecpk-pascal-yim.ipynb · 1040 KB · 5/11/2026
    下载
  • ML-3ML3 : Classification
    ml3-ecpk-pascal-yim.ipynb · 61 KB · 5/11/2026
    下载
  • ML-4ML4 : datas
    ml4-ecpk-pascal-yim.ipynb · 90 KB · 5/11/2026
    下载

额外数据集

  • Dataset alien vs predator
    archive (3).zip · 14476 KB · 5/15/2026
    下载