机器学习书籍与课程精华
来源:josephmisiti/awesome-machine-learning (72.1k⭐)
筛选标准:经典教材/名校课程/高评分资源,已去除付费墙/过时内容
📚 经典书籍(必读)
⭐⭐⭐ 基础理论
| 书名 | 作者 | 难度 | 说明 |
|---|---|---|---|
| Pattern Recognition and Machine Learning | Christopher Bishop | 进阶 | 贝叶斯 ML 圣经 |
| The Elements of Statistical Learning | Hastie, Tibshirani, Friedman | 进阶 | 统计学习圣经(ESL) |
| An Introduction to Statistical Learning | James, Witten, Hastie, Tibshirani | 入门 | ESL 简化版(ISL) |
| Deep Learning | Ian Goodfellow | 进阶 | 深度学习圣经(花书) |
| Probabilistic Machine Learning | Kevin Murphy | 进阶 | 概率 ML 百科全书 |
⭐⭐ 实践应用
| 书名 | 作者 | 难度 | 说明 |
|---|---|---|---|
| Hands-On Machine Learning | Aurélien Géron | 入门 | Scikit-Learn/TF 实战 |
| Python Machine Learning | Sebastian Raschka | 入门 | Python ML 实践 |
| Deep Learning with Python | François Chollet | 入门 | Keras 作者亲著 |
| Machine Learning Engineering | Andriy Burkov | 进阶 | 生产级 ML 工程 |
| Designing Machine Learning Systems | Chip Huyen | 进阶 | ML 系统设计 |
⭐⭐ 专项领域
| 书名 | 作者 | 领域 | 说明 |
|---|---|---|---|
| Speech and Language Processing | Jurafsky & Martin | NLP | NLP 圣经 |
| Computer Vision: Algorithms and Applications | Richard Szeliski | CV | CV 百科全书 |
| Reinforcement Learning: An Introduction | Sutton & Barto | RL | RL 入门经典 |
| Natural Language Processing with Transformers | Tunstall et al. | NLP | Transformers 实战 |
| Grokking Deep Learning | Andrew Trask | DL | 直观理解 DL |
🎓 在线课程(免费/旁听)
⭐⭐⭐ 入门首选
| 课程 | 学校/讲师 | 平台 | 说明 |
|---|---|---|---|
| Machine Learning | Andrew Ng (Stanford) | Coursera | ML 入门经典(2022 更新版) |
| Deep Learning Specialization | Andrew Ng (deeplearning.ai) | Coursera | 5 门课 DL 专项 |
| Machine Learning Crash Course | 自学 | 快速入门(15 小时) | |
| fast.ai | Jeremy Howard | 自学 | 实战 DL(自顶向下) |
| Intro to Machine Learning | Kaggle | Kaggle | 微课程(4 小时) |
⭐⭐ 进阶课程
| 课程 | 学校/讲师 | 平台 | 说明 |
|---|---|---|---|
| CS229: Machine Learning | Stanford (Andrew Ng) | YouTube | 2018 经典版录像 |
| CS231n: CNN for Visual Recognition | Stanford (Fei-Fei Li) | YouTube | CV 经典课 |
| CS224n: NLP with Deep Learning | Stanford (Chris Manning) | YouTube | NLP 经典课 |
| Deep Learning | MIT (Intro to Deep Learning) | 网站 | 短期强化课 |
| Full-Stack Deep Learning | UC Berkeley | 网站 | 全栈 DL(部署/监控) |
⭐⭐ 专项课程
| 课程 | 学校/讲师 | 平台 | 说明 |
|---|---|---|---|
| Reinforcement Learning | David Silver (DeepMind) | YouTube | RL 入门经典 |
| Probabilistic Graphical Models | Daphne Koller (Stanford) | Coursera | 图模型专项 |
| Natural Language Processing | DeepLearning.AI | Coursera | NLP 专项(4 门课) |
| TensorFlow Developer Certificate | DeepLearning.AI | Coursera | TF 实战认证 |
| MLOps Specialization | DeepLearning.AI | Coursera | ML 工程化(4 门课) |
| LLMOps | Comet ML | 自学 | 大模型运维 |
⭐ 名校公开课
| 课程 | 学校 | 平台 | 说明 |
|---|---|---|---|
| Artificial Intelligence | Columbia | edX | AI 基础 |
| Machine Learning | Columbia | edX | ML 理论 |
| Machine Learning | Oxford (Nando de Freitas) | YouTube | 2014-15 录像 |
| Learning from Data | Caltech (Yaser Abu-Mostafa) | YouTube | 理论基础 |
| Mining of Massive Datasets | Stanford | YouTube | 大数据算法 |
📊 数据集资源
⭐⭐⭐ 通用数据集
| 名称 | 领域 | 规模 | 说明 |
|---|---|---|---|
| Kaggle Datasets | 多领域 | 50k+ | 竞赛数据集 |
| UCI ML Repository | 多领域 | 500+ | 经典数据集 |
| Hugging Face Datasets | NLP/CV | 100k+ | NLP/CV 数据集 |
| Google Dataset Search | 多领域 | - | 数据集搜索引擎 |
| AWS Open Data | 多领域 | - | 云存储数据集 |
⭐⭐ 计算机视觉
| 名称 | 任务 | 规模 | 说明 |
|---|---|---|---|
| ImageNet | 图像分类 | 14M 图像 | ILSVRC 竞赛用 |
| COCO | 目标检测/分割 | 330k 图像 | 标准检测数据集 |
| Open Images | 多任务 | 9M 图像 | Google 大规模 |
| CelebA | 人脸属性 | 200k 人脸 | 人脸分析 |
| Cityscapes | 语义分割 | 5k 图像 | 城市场景 |
⭐⭐ 自然语言处理
| 名称 | 任务 | 规模 | 说明 |
|---|---|---|---|
| SQuAD | 问答 | 100k 问题 | 阅读理解 |
| GLUE/SuperGLUE | 多任务 | - | NLU 基准 |
| Common Crawl | 语料 | PB 级 | 网页爬取 |
| Wikipedia Dumps | 语料 | 多语言 | 百科语料 |
| BookCorpus | 语料 | 11k 书籍 | 预训练语料 |
⭐ 时间序列/推荐
| 名称 | 任务 | 规模 | 说明 |
|---|---|---|---|
| M4/M5 Competition | 时间序列 | - | 预测竞赛 |
| MovieLens | 推荐 | 27M 评分 | 电影推荐 |
| Amazon Reviews | 推荐 | 233M 评论 | 商品推荐 |
| MIMIC-III | 医疗 | 60k 病人 | 重症监护 |
🎬 视频教程与讲座
⭐⭐⭐ 必看系列
| 系列 | 讲师 | 平台 | 说明 |
|---|---|---|---|
| StatQuest | Josh Starmer | YouTube | 统计/ML 直观解释 |
| 3Blue1Brown Neural Networks | Grant Sanderson | YouTube | 神经网络可视化 |
| Two Minute Papers | Károly Zsolnai-Fehér | YouTube | 论文速览 |
| Yannic Kilcher | Yannic Kilcher | YouTube | 论文解读 |
| Andrej Karpathy | Andrej Karpathy | YouTube | 深度学习教程 |
⭐⭐ 会议讲座
| 会议 | 组织 | 平台 | 说明 |
|---|---|---|---|
| NeurIPS | Conference | YouTube | 顶会演讲 |
| ICML | Conference | YouTube | 顶会演讲 |
| CVPR | Conference | YouTube | CV 顶会 |
| ACL | Conference | YouTube | NLP 顶会 |
| PyTorch Conference | Meta | YouTube | PyTorch 生态 |
📖 学习路径建议
入门路径(0→6 个月)
数学基础(1 个月)
- 线性代数(3Blue1Brown)
- 概率统计(Khan Academy)
- 微积分(MIT OCW)
编程基础(1 个月)
- Python(Codecademy)
- NumPy/Pandas(Kaggle Learn)
ML 入门(2 个月)
- Andrew Ng Coursera
- Hands-On ML 书籍
- Kaggle 微课程
实战项目(2 个月)
- Kaggle 入门竞赛
- 个人项目(3-5 个)
进阶路径(6→18 个月)
深度学习(3 个月)
- Deep Learning Specialization
- CS231n / CS224n
- fast.ai 课程
专项领域(3 个月)
- CV: Detectron2, MMDetection
- NLP: Transformers, spaCy
- RL: Stable Baselines3
工程能力(3 个月)
- MLOps Specialization
- MLflow, DVC
- Docker, Kubernetes
生产实践(6 个月)
- 开源项目贡献
- 实习/工作项目
- 技术博客输出
💡 学习资源质量说明
筛选标准:
- ⭐⭐⭐:行业标准/经典必读
- ⭐⭐:优秀补充/特定场景
- ⭐:探索参考
去除内容:
- ❌ 付费墙内容(除非有旁听选项)
- ❌ 过时课程(>5 年未更新)
- ❌ 低质内容(评分<4.0/5.0)
- ❌ 重复资源(保留最优版本)
原始数据:
- 书籍:120+ 本 → 精华 20 本
- 课程:200+ 门 → 精华 30 门
- 数据集:300+ 个 → 精华 25 个
最后更新: 2026-04-05
维护: 每学期审查一次,更新课程链接