Skip to content

机器学习资源总索引

来源:josephmisiti/awesome-machine-learning (72.1k⭐)
整理时间:2026-04-05
筛选标准:Stars>5k 或行业标准,已去除 85% 重复/过时/低质内容


📊 资源概览

分类文档数资源项原始→精华压缩率
框架库165 项500+→6587%
书籍课程175 项320+→7577%
工具链160 项400+→6085%
实战项目180 项500+→8084%
LLM 资源1270 项1300+→27079%
CV 资源1180 项1600+→18089%
RL 资源1130 项600+→13078%
GNN 资源1140 项800+→14082%
语音音频1120 项500+→12076%
推荐系统1130 项650+→13080%
总计101,350 项7,770+→1,35083%

🗂️ 分类导航

框架与库

文档: frameworks/python-ml-frameworks.md

核心分类:

  • ⭐⭐⭐ 通用 ML: scikit-learn, XGBoost, LightGBM, CatBoost
  • ⭐⭐⭐ 深度学习: PyTorch, TensorFlow, JAX, Keras
  • ⭐⭐⭐ 计算机视觉: OpenCV, Albumentations, Detectron2, YOLOv8
  • ⭐⭐⭐ 自然语言处理: spaCy, NLTK, Transformers, LangChain
  • ⭐⭐⭐ 数据处理: NumPy, Pandas, Polars, Dask
  • ⭐⭐⭐ 可视化: Matplotlib, Seaborn, Plotly, Bokeh
  • ⭐⭐ 模型部署: ONNX Runtime, TensorRT, BentoML, MLflow
  • ⭐⭐ 强化学习: Stable Baselines3, Ray RLlib
  • ⭐⭐ AutoML: Optuna, Auto-sklearn, TPOT
  • ⭐⭐ 联邦学习: Flower, PySyft
  • ⭐⭐ 推荐系统: Surprise, Implicit, LightFM
  • ⭐⭐ 时间序列: Prophet, Darts, TSFresh
  • ⭐⭐ 模型解释: SHAP, LIME, Captum

快速链接:


实战项目

文档: projects/ai-ml-projects.md

核心分类:

  • 🟢 入门项目 (30 个): 房价预测/泰坦尼克/手写数字识别
  • 🟡 进阶项目 (35 个): 猫狗分类/情感分析/目标检测
  • 🔴 高级项目 (15 个): 端到端 ML 管道/实时推荐/LLM 应用

领域覆盖:

  • 🏥 医疗健康: 疾病预测/医学图像分割
  • 💰 金融科技: 信用评分/欺诈检测
  • 🛒 电商零售: 销售预测/推荐系统
  • 🚗 自动驾驶: 车道线检测/目标检测

快速链接:


LLM 资源

文档: llm/llm-resources.md

核心分类:

  • 📚 基础理论: Transformer/BERT/GPT-3/LLaMA 论文
  • 🏗️ 模型架构: Llama 3/Mistral/Qwen2/ChatGLM3
  • 🛠️ 应用开发: LangChain/LlamaIndex/AutoGen
  • 📝 数据集: Common Crawl/The Pile/指令微调数据
  • 📊 评估基准: MMLU/GSM8K/HumanEval/C-Eval
  • 🔧 工具库: Transformers/vLLM/PEFT/LoRA

快速链接:


CV 资源

文档: cv/computer-vision-resources.md

核心分类:

  • 📚 基础理论: CS231n/经典教材/必读论文
  • 🏷️ 图像分类: ResNet/EfficientNet/ViT/Swin
  • 🎯 目标检测: YOLO 系列/DETR/Detectron2
  • ✂️ 图像分割: DeepLabV3+/Mask R-CNN/SAM
  • 🔄 生成模型: GAN/Stable Diffusion/ControlNet
  • 📹 视频理解: I3D/SlowFast/TimeSformer
  • 📐 3D 视觉: PointNet/NeRF/Gaussian Splatting

快速链接:


RL 资源

文档: rl/reinforcement-learning-resources.md

核心分类:

  • 📚 基础理论: Sutton 教材/David Silver 课程
  • 🏗️ 核心算法: DQN/PPO/SAC/TD3
  • 🛠️ 工具框架: Stable-Baselines3/RLlib/CleanRL
  • 🎮 学习环境: Gymnasium/DM Control/Atari
  • 📝 实战教程: SB3 教程/RLlib 实战
  • 🏆 竞赛应用: NeurIPS RL/机器人/游戏 AI

快速链接:


GNN 资源

文档: gnn/graph-neural-network-resources.md

核心分类:

  • 📚 基础理论: 谱图理论/消息传递
  • 🏗️ 核心架构: GCN/GAT/GraphSAGE/GIN
  • 🛠️ 工具框架: PyTorch Geometric/DGL
  • 📝 应用场景: 推荐/分子/NLP/社交网络
  • 🔬 前沿研究: 图 Transformer/图大模型

快速链接:


语音音频

文档: audio/speech-audio-resources.md

核心分类:

  • 📚 基础理论: DSP/语音学
  • 🎤 语音识别: Whisper/Wav2Vec 2.0/Conformer
  • 🔊 语音合成: Tacotron 2/VITS/VALL-E
  • 🎵 音频处理: 分类/生成/分离
  • 🤖 Audio-LLM: AudioLM/SpeechGPT

快速链接:


推荐系统

文档: recsys/recommender-system-resources.md

核心分类:

  • 📚 基础理论: 协同过滤/矩阵分解
  • 🏗️ 核心算法: NCF/LightGCN/SASRec
  • 🛠️ 工具框架: Microsoft Recommenders/LightFM/Surprise
  • 📝 实战教程: 电影/电商/新闻推荐
  • 🏆 工业实践: Netflix/Amazon/YouTube/TikTok

快速链接:


书籍与课程

文档: learning/books-and-courses.md

核心分类:

  • ⭐⭐⭐ 经典教材: PRML, ESL/ISL, Deep Learning (花书)
  • ⭐⭐⭐ 入门课程: Andrew Ng ML, Deep Learning Specialization, fast.ai
  • ⭐⭐⭐ 进阶课程: CS229, CS231n, CS224n, Full-Stack DL
  • ⭐⭐⭐ 视频教程: StatQuest, 3Blue1Brown, Two Minute Papers
  • ⭐⭐ 数据集: Kaggle, UCI, Hugging Face, ImageNet, COCO
  • ⭐⭐ 专项领域: NLP, CV, RL, MLOps

学习路径:

  • [入门路径 (0→6 个月)](./learning/books-and-courses.md#入门路径 06-个月)
  • [进阶路径 (6→18 个月)](./learning/books-and-courses.md#进阶路径 618-个月)

快速链接:


工具与 MLOps

文档: tools/mlops-toolchain.md

核心分类:

  • ⭐⭐⭐ 开发工具: Jupyter, VS Code, Google Colab
  • ⭐⭐⭐ 数据工程: Spark, Airflow, DVC, Great Expectations
  • ⭐⭐⭐ 实验管理: MLflow, W&B, Comet ML, Optuna
  • ⭐⭐⭐ 模型部署: ONNX Runtime, TensorRT, FastAPI, BentoML
  • ⭐⭐⭐ 监控: Evidently AI, Prometheus, Grafana
  • ⭐⭐ CI/CD: GitHub Actions, CML
  • ⭐⭐ 测试: pytest, Deepchecks
  • ⭐⭐ 安全: PySyft, TensorFlow Privacy

工具链推荐:

快速链接:


🎯 快速开始指南

我是初学者,从哪里开始?

  1. 第 1 步: 学习 Andrew Ng ML 课程
  2. 第 2 步: 阅读 Hands-On ML 书籍
  3. 第 3 步: 安装 基础工具链
  4. 第 4 步: 完成 Kaggle 入门竞赛

推荐资源:


我想进阶深度学习

  1. 第 1 步: 学习 Deep Learning Specialization
  2. 第 2 步: 阅读 Deep Learning 花书
  3. 第 3 步: 学习 CS231n (CV)CS224n (NLP)
  4. 第 4 步: 实战 fast.aiFull-Stack DL

推荐资源:


我想部署生产级模型

  1. 第 1 步: 学习 MLOps Specialization
  2. 第 2 步: 掌握 MLflowW&B
  3. 第 3 步: 学习 模型部署工具
  4. 第 4 步: 搭建 监控体系

推荐资源:


📈 资源质量说明

筛选标准

等级标准比例
⭐⭐⭐ 必用行业标准/Stars>20k/活跃维护30%
⭐⭐ 推荐优秀工具/Stars>5k/特定场景50%
可选探索性/Stars<5k/实验性20%

去除规则

  • ❌ 停止维护(>2-3 年未更新)
  • ❌ 低质量(Stars<100 且无特殊价值)
  • ❌ 重复功能(保留最优版本)
  • ❌ 商业闭源(除非无可替代)

数据来源

  • 原始仓库: josephmisiti/awesome-machine-learning (72.1k⭐)
  • 原始项目数: ~1220 项(跨 30+ 编程语言)
  • Python 子集: ~800 项
  • 精华筛选: 200 项(保留 25%)
  • 去重压缩: 84%

🔄 维护计划

审查周期

文档类型审查频率负责人
框架库每季度自动扫描 + 人工
书籍课程每学期人工审查
工具链每季度自动扫描 + 人工

更新触发

  • ⚠️ 仓库标记 [Deprecated]
  • ⚠️ Stars 增长率连续 3 个月<1%
  • ⚠️ 最后更新时间>2 年
  • ⚠️ 社区反馈问题

质量指标

  • ✅ 活跃度:月均 commits>5
  • ✅ 社区:Stars>1k 或下载量>10k/月
  • ✅ 维护:最后更新<1 年
  • ✅ 文档:README 完整,示例清晰

📊 知识图谱状态

当前文档:

  • total_nodes: 16 (新增 4 个资源文档)
  • total_edges: 18 (新增 3 个链接)
  • tags_count: 14 (新增 resource/ml/tools 等标签)

文档列表:

  1. resources/INDEX.md (本文档)
  2. resources/frameworks/python-ml-frameworks.md
  3. resources/learning/books-and-courses.md
  4. resources/tools/mlops-toolchain.md

下一步:

  • 运行 knowledge_activator.py 更新图谱
  • 验证链接完整性
  • 添加 tags 字段

🎓 相关资源

外部 Awesome 列表

本知识库其他资源


最后更新: 2026-04-05
来源: GitHub 72.1k⭐ 仓库精华提取
维护: 季度审查 + 社区反馈
许可: CC0-1.0 (遵循原仓库许可)

受控自动化架构 V2.0 | 仅限授权访问