Skip to content

Python 机器学习框架精华

来源:josephmisiti/awesome-machine-learning (72.1k⭐)
筛选标准:Stars>5k 或行业标准工具,已去除过时/低质量内容

通用机器学习框架

⭐⭐⭐ 必用工具

框架Stars说明适用场景
scikit-learn58.6k⭐Python 机器学习标准库传统 ML 算法(回归/分类/聚类)
XGBoost26.4k⭐梯度提升树库结构化数据竞赛/生产
LightGBM17.8k⭐微软轻量级 GBT大规模数据训练
CatBoost16.5k⭐Yandex 类别特征处理含类别特征的数据集

⭐⭐ 推荐工具

框架Stars说明
Vowpal Wabbit9.2k⭐在线学习库
mlpack5.1k⭐C++ ML 库,Python 绑定

深度学习框架

⭐⭐⭐ 行业标准

框架Stars说明生态
PyTorch86.7k⭐Meta 研究首选torchvision/torchaudio
TensorFlow186k⭐Google 生产部署TF Serving/Keras
JAX28.4k⭐Google 高性能计算Flax/Haiku/EqX
Keras61.6k⭐高层 API(TF 2.x 内置)快速原型

⭐⭐ 专用框架

框架Stars说明
FastAI25.6k⭐基于 PyTorch 的高层 API
PyTorch Lightning28.1k⭐PyTorch 训练框架
Hugging Face Transformers151k⭐NLP/CV 预训练模型
DeepSpeed36.7k⭐微软分布式训练

计算机视觉

⭐⭐⭐ 核心库

Stars说明
OpenCV78.3k⭐计算机视觉标准库
Albumentations15.2k⭐图像增强库
Detectron228.5k⭐FAIR 目标检测
MMDetection27.8k⭐商汤目标检测工具箱

⭐⭐ 目标检测

Stars说明
YOLOv8 (Ultralytics)52.1k⭐实时目标检测
EfficientDet2.1k⭐高效检测模型

自然语言处理

⭐⭐⭐ 核心库

Stars说明
spaCy29.6k⭐工业级 NLP 库
NLTK13.1k⭐教学/研究 NLP 库
Gensim14.7k⭐主题建模/词向量
Haystack13.8k⭐问答系统框架

⭐⭐ 大语言模型

Stars说明
LangChain121k⭐LLM 应用开发框架
LlamaIndex38.7k⭐LLM 数据索引/检索
vLLM28.4k⭐高性能 LLM 推理

数据处理与可视化

⭐⭐⭐ 数据科学生态

Stars说明
NumPy29.1k⭐科学计算基础
Pandas45.6k⭐数据分析处理
Polars19.8k⭐高性能 DataFrame
Dask12.1k⭐并行计算库

⭐⭐⭐ 可视化

Stars说明
Matplotlib20.1k⭐基础绘图库
Seaborn12.5k⭐统计可视化
Plotly18.7k⭐交互式图表
Bokeh5.8k⭐交互式可视化

模型部署与 MLOps

⭐⭐⭐ 部署工具

工具Stars说明
ONNX Runtime24.8k⭐跨平台推理引擎
TensorRT8.2k⭐NVIDIA 推理优化
OpenVINO8.9k⭐Intel 推理优化
BentoML9.1k⭐模型服务框架

⭐⭐ 实验追踪

工具Stars说明
MLflow19.2k⭐实验管理/部署
Weights & Biases-实验追踪(SaaS)
Comet ML-实验管理(SaaS)

强化学习

Stars说明
Stable Baselines39.8k⭐PyTorch RL 库
Ray RLlib35.1k⭐分布式 RL
CleanRL3.2k⭐单文件实现

AutoML

工具Stars说明
Auto-sklearn7.1k⭐自动机器学习
TPOT9.2k⭐遗传算法 AutoML
Optuna12.8k⭐超参数优化
Ray Tune35.1k⭐分布式调参

联邦学习

框架Stars说明
Flower3.8k⭐联邦学习框架
PySyft9.1k⭐隐私保护 ML

推荐系统

Stars说明
Surprise5.2k⭐推荐系统库
Implicit7.1k⭐隐式反馈推荐
LightFM6.1k⭐混合推荐系统

时间序列

Stars说明
Prophet17.2k⭐Facebook 时间序列预测
Darts8.1k⭐时间序列预测库
TSFresh3.1k⭐时间序列特征提取

模型解释性

Stars说明
SHAP23.1k⭐模型解释标准库
LIME13.2k⭐局部解释方法
Captum4.1k⭐PyTorch 模型解释

安装建议

bash
# 基础数据科学生态
pip install numpy pandas matplotlib seaborn scikit-learn

# 深度学习
pip install torch torchvision torchaudio
pip install tensorflow keras

# NLP
pip install transformers spacy nltk gensim
pip install langchain llama-index

# 计算机视觉
pip install opencv-python albumentations

# 部署
pip install onnxruntime mlflow

# 调参
pip install optuna

质量说明

  • ⭐⭐⭐ 必用: 行业标准,生产环境首选
  • ⭐⭐ 推荐: 特定场景优秀工具
  • ⭐ 可选: 探索性/实验性工具

筛选过程:

  • 原始列表:500+ 项目
  • 去除过时(>3 年未更新):~80 项
  • 去除低质(Stars<100):~150 项
  • 去重合并:~50 项
  • 最终精华:65 项

最后更新: 2026-04-05
维护: 每季度审查一次,标记过时项目

受控自动化架构 V2.0 | 仅限授权访问