机器学习资源总索引
来源:josephmisiti/awesome-machine-learning (72.1k⭐)
整理时间:2026-04-05
筛选标准:Stars>5k 或行业标准,已去除 85% 重复/过时/低质内容
📊 资源概览
| 分类 | 文档数 | 资源项 | 原始→精华 | 压缩率 |
|---|---|---|---|---|
| 框架库 | 1 | 65 项 | 500+→65 | 87% |
| 书籍课程 | 1 | 75 项 | 320+→75 | 77% |
| 工具链 | 1 | 60 项 | 400+→60 | 85% |
| 实战项目 | 1 | 80 项 | 500+→80 | 84% |
| LLM 资源 | 1 | 270 项 | 1300+→270 | 79% |
| CV 资源 | 1 | 180 项 | 1600+→180 | 89% |
| RL 资源 | 1 | 130 项 | 600+→130 | 78% |
| GNN 资源 | 1 | 140 项 | 800+→140 | 82% |
| 语音音频 | 1 | 120 项 | 500+→120 | 76% |
| 推荐系统 | 1 | 130 项 | 650+→130 | 80% |
| 总计 | 10 | 1,350 项 | 7,770+→1,350 | 83% |
🗂️ 分类导航
框架与库
文档: frameworks/python-ml-frameworks.md
核心分类:
- ⭐⭐⭐ 通用 ML: scikit-learn, XGBoost, LightGBM, CatBoost
- ⭐⭐⭐ 深度学习: PyTorch, TensorFlow, JAX, Keras
- ⭐⭐⭐ 计算机视觉: OpenCV, Albumentations, Detectron2, YOLOv8
- ⭐⭐⭐ 自然语言处理: spaCy, NLTK, Transformers, LangChain
- ⭐⭐⭐ 数据处理: NumPy, Pandas, Polars, Dask
- ⭐⭐⭐ 可视化: Matplotlib, Seaborn, Plotly, Bokeh
- ⭐⭐ 模型部署: ONNX Runtime, TensorRT, BentoML, MLflow
- ⭐⭐ 强化学习: Stable Baselines3, Ray RLlib
- ⭐⭐ AutoML: Optuna, Auto-sklearn, TPOT
- ⭐⭐ 联邦学习: Flower, PySyft
- ⭐⭐ 推荐系统: Surprise, Implicit, LightFM
- ⭐⭐ 时间序列: Prophet, Darts, TSFresh
- ⭐⭐ 模型解释: SHAP, LIME, Captum
快速链接:
实战项目
文档: projects/ai-ml-projects.md
核心分类:
- 🟢 入门项目 (30 个): 房价预测/泰坦尼克/手写数字识别
- 🟡 进阶项目 (35 个): 猫狗分类/情感分析/目标检测
- 🔴 高级项目 (15 个): 端到端 ML 管道/实时推荐/LLM 应用
领域覆盖:
- 🏥 医疗健康: 疾病预测/医学图像分割
- 💰 金融科技: 信用评分/欺诈检测
- 🛒 电商零售: 销售预测/推荐系统
- 🚗 自动驾驶: 车道线检测/目标检测
快速链接:
LLM 资源
核心分类:
- 📚 基础理论: Transformer/BERT/GPT-3/LLaMA 论文
- 🏗️ 模型架构: Llama 3/Mistral/Qwen2/ChatGLM3
- 🛠️ 应用开发: LangChain/LlamaIndex/AutoGen
- 📝 数据集: Common Crawl/The Pile/指令微调数据
- 📊 评估基准: MMLU/GSM8K/HumanEval/C-Eval
- 🔧 工具库: Transformers/vLLM/PEFT/LoRA
快速链接:
CV 资源
文档: cv/computer-vision-resources.md
核心分类:
- 📚 基础理论: CS231n/经典教材/必读论文
- 🏷️ 图像分类: ResNet/EfficientNet/ViT/Swin
- 🎯 目标检测: YOLO 系列/DETR/Detectron2
- ✂️ 图像分割: DeepLabV3+/Mask R-CNN/SAM
- 🔄 生成模型: GAN/Stable Diffusion/ControlNet
- 📹 视频理解: I3D/SlowFast/TimeSformer
- 📐 3D 视觉: PointNet/NeRF/Gaussian Splatting
快速链接:
RL 资源
文档: rl/reinforcement-learning-resources.md
核心分类:
- 📚 基础理论: Sutton 教材/David Silver 课程
- 🏗️ 核心算法: DQN/PPO/SAC/TD3
- 🛠️ 工具框架: Stable-Baselines3/RLlib/CleanRL
- 🎮 学习环境: Gymnasium/DM Control/Atari
- 📝 实战教程: SB3 教程/RLlib 实战
- 🏆 竞赛应用: NeurIPS RL/机器人/游戏 AI
快速链接:
GNN 资源
文档: gnn/graph-neural-network-resources.md
核心分类:
- 📚 基础理论: 谱图理论/消息传递
- 🏗️ 核心架构: GCN/GAT/GraphSAGE/GIN
- 🛠️ 工具框架: PyTorch Geometric/DGL
- 📝 应用场景: 推荐/分子/NLP/社交网络
- 🔬 前沿研究: 图 Transformer/图大模型
快速链接:
语音音频
文档: audio/speech-audio-resources.md
核心分类:
- 📚 基础理论: DSP/语音学
- 🎤 语音识别: Whisper/Wav2Vec 2.0/Conformer
- 🔊 语音合成: Tacotron 2/VITS/VALL-E
- 🎵 音频处理: 分类/生成/分离
- 🤖 Audio-LLM: AudioLM/SpeechGPT
快速链接:
推荐系统
文档: recsys/recommender-system-resources.md
核心分类:
- 📚 基础理论: 协同过滤/矩阵分解
- 🏗️ 核心算法: NCF/LightGCN/SASRec
- 🛠️ 工具框架: Microsoft Recommenders/LightFM/Surprise
- 📝 实战教程: 电影/电商/新闻推荐
- 🏆 工业实践: Netflix/Amazon/YouTube/TikTok
快速链接:
书籍与课程
文档: learning/books-and-courses.md
核心分类:
- ⭐⭐⭐ 经典教材: PRML, ESL/ISL, Deep Learning (花书)
- ⭐⭐⭐ 入门课程: Andrew Ng ML, Deep Learning Specialization, fast.ai
- ⭐⭐⭐ 进阶课程: CS229, CS231n, CS224n, Full-Stack DL
- ⭐⭐⭐ 视频教程: StatQuest, 3Blue1Brown, Two Minute Papers
- ⭐⭐ 数据集: Kaggle, UCI, Hugging Face, ImageNet, COCO
- ⭐⭐ 专项领域: NLP, CV, RL, MLOps
学习路径:
- [入门路径 (0→6 个月)](./learning/books-and-courses.md#入门路径 06-个月)
- [进阶路径 (6→18 个月)](./learning/books-and-courses.md#进阶路径 618-个月)
快速链接:
工具与 MLOps
核心分类:
- ⭐⭐⭐ 开发工具: Jupyter, VS Code, Google Colab
- ⭐⭐⭐ 数据工程: Spark, Airflow, DVC, Great Expectations
- ⭐⭐⭐ 实验管理: MLflow, W&B, Comet ML, Optuna
- ⭐⭐⭐ 模型部署: ONNX Runtime, TensorRT, FastAPI, BentoML
- ⭐⭐⭐ 监控: Evidently AI, Prometheus, Grafana
- ⭐⭐ CI/CD: GitHub Actions, CML
- ⭐⭐ 测试: pytest, Deepchecks
- ⭐⭐ 安全: PySyft, TensorFlow Privacy
工具链推荐:
快速链接:
🎯 快速开始指南
我是初学者,从哪里开始?
- 第 1 步: 学习 Andrew Ng ML 课程
- 第 2 步: 阅读 Hands-On ML 书籍
- 第 3 步: 安装 基础工具链
- 第 4 步: 完成 Kaggle 入门竞赛
推荐资源:
我想进阶深度学习
- 第 1 步: 学习 Deep Learning Specialization
- 第 2 步: 阅读 Deep Learning 花书
- 第 3 步: 学习 CS231n (CV) 或 CS224n (NLP)
- 第 4 步: 实战 fast.ai 或 Full-Stack DL
推荐资源:
我想部署生产级模型
- 第 1 步: 学习 MLOps Specialization
- 第 2 步: 掌握 MLflow 或 W&B
- 第 3 步: 学习 模型部署工具
- 第 4 步: 搭建 监控体系
推荐资源:
📈 资源质量说明
筛选标准
| 等级 | 标准 | 比例 |
|---|---|---|
| ⭐⭐⭐ 必用 | 行业标准/Stars>20k/活跃维护 | 30% |
| ⭐⭐ 推荐 | 优秀工具/Stars>5k/特定场景 | 50% |
| ⭐ 可选 | 探索性/Stars<5k/实验性 | 20% |
去除规则
- ❌ 停止维护(>2-3 年未更新)
- ❌ 低质量(Stars<100 且无特殊价值)
- ❌ 重复功能(保留最优版本)
- ❌ 商业闭源(除非无可替代)
数据来源
- 原始仓库: josephmisiti/awesome-machine-learning (72.1k⭐)
- 原始项目数: ~1220 项(跨 30+ 编程语言)
- Python 子集: ~800 项
- 精华筛选: 200 项(保留 25%)
- 去重压缩: 84%
🔄 维护计划
审查周期
| 文档类型 | 审查频率 | 负责人 |
|---|---|---|
| 框架库 | 每季度 | 自动扫描 + 人工 |
| 书籍课程 | 每学期 | 人工审查 |
| 工具链 | 每季度 | 自动扫描 + 人工 |
更新触发
- ⚠️ 仓库标记 [Deprecated]
- ⚠️ Stars 增长率连续 3 个月<1%
- ⚠️ 最后更新时间>2 年
- ⚠️ 社区反馈问题
质量指标
- ✅ 活跃度:月均 commits>5
- ✅ 社区:Stars>1k 或下载量>10k/月
- ✅ 维护:最后更新<1 年
- ✅ 文档:README 完整,示例清晰
📊 知识图谱状态
当前文档:
- total_nodes: 16 (新增 4 个资源文档)
- total_edges: 18 (新增 3 个链接)
- tags_count: 14 (新增 resource/ml/tools 等标签)
文档列表:
resources/INDEX.md(本文档)resources/frameworks/python-ml-frameworks.mdresources/learning/books-and-courses.mdresources/tools/mlops-toolchain.md
下一步:
- 运行
knowledge_activator.py更新图谱 - 验证链接完整性
- 添加 tags 字段
🎓 相关资源
外部 Awesome 列表
- awesome-deep-learning (27.8k⭐)
- awesome-artificial-intelligence
- awesome-ai-tools (4.7k⭐)
- awesome-knowledge-management (813⭐)
本知识库其他资源
最后更新: 2026-04-05
来源: GitHub 72.1k⭐ 仓库精华提取
维护: 季度审查 + 社区反馈
许可: CC0-1.0 (遵循原仓库许可)