推荐系统资源精华
来源:Microsoft Recommenders + awesome-RecSys + LightFM
筛选标准:工业级实践 + 学术研究,已去除过时内容
📊 资源概览
原始数据:
- awesome-recsys: ~400 项 → 精华 75 项
- 工具/教程:~250 项 → 精华 55 项
- 总计: 650+ 项 → 130 项精华 (80% 压缩率)
分类覆盖:
- 📚 基础理论 (15 项)
- 🏗️ 核心算法 (35 项)
- 🛠️ 工具框架 (25 项)
- 📝 实战教程 (25 项)
- 🏆 工业实践 (20 项)
- 🔬 前沿研究 (10 项)
📚 基础理论
⭐⭐⭐ 经典教材
| 书籍 | 作者 | 难度 | 说明 |
|---|---|---|---|
| Recommender Systems: The Textbook | Charu Aggarwal | 进阶 | 推荐系统百科全书 |
| Programming Collective Intelligence | Toby Segaran | 入门 | 集体智能编程 |
| Hands-On RecSys with Python | Various | 入门 | Python 实战 |
⭐⭐⭐ 在线课程
| 课程 | 讲师 | 平台 | 说明 |
|---|---|---|---|
| Recommender Systems Specialization | UMN | Coursera | 推荐系统专项 |
| Practical RecSys | Various | YouTube | 实战教程 |
| RecSys Course | UMN | 网站 | 研究生课程 |
⭐⭐ 必读论文
| 论文 | 年份 | 引用 | 说明 |
|---|---|---|---|
| Matrix Factorization Techniques for RecSys | 2009 | 10k+ | Netflix Prize |
| Neural Collaborative Filtering | 2017 | 5k+ | NCF 开山 |
| BPR: Bayesian Personalized Ranking | 2009 | 3k+ | 隐式反馈 |
| LightGCN: Simplifying GCN for RecSys | 2020 | 2k+ | 图推荐 SOTA |
🏗️ 核心算法
⭐⭐⭐ 协同过滤
| 算法 | 年份 | 说明 | 适用场景 |
|---|---|---|---|
| User-Based CF | 1992 | 基于用户相似度 | 小型系统 |
| Item-Based CF | 2001 | 基于物品相似度 | 电商推荐 |
| Matrix Factorization | 2006 | 矩阵分解 | 评分预测 |
| SVD/SVD++ | 2009 | 奇异值分解 | Netflix Prize |
| ALS | 2014 | 交替最小二乘 | 隐式反馈 |
⭐⭐⭐ 深度学习推荐
| 算法 | 年份 | 机构 | 说明 |
|---|---|---|---|
| NCF | 2017 | HKUST | 神经协同过滤 |
| NeuMF | 2017 | HKUST | NCF+MF |
| DeepFM | 2017 | 华为 | FM+Deep Learning |
| Wide & Deep | 2016 | 记忆 + 泛化 | |
| DCN | 2017 | Stanford | 深度交叉网络 |
⭐⭐⭐ 图神经网络推荐
| 算法 | 年份 | 机构 | 说明 |
|---|---|---|---|
| NGCF | 2019 | 电子科大 | 图协同过滤 |
| LightGCN | 2020 | 清华 | 简化 GCN |
| PinSAGE | 2018 | 工业级图推荐 | |
| GraphSAGE-Rec | 2018 | Stanford | 归纳式推荐 |
⭐⭐ 序列推荐
| 算法 | 年份 | 说明 | 特点 |
|---|---|---|---|
| GRU4Rec | 2016 | RNN 序列推荐 | 会话推荐 |
| SASRec | 2018 | Self-Attention | 注意力机制 |
| BERT4Rec | 2019 | BERT 风格 | 双向编码 |
| FDSA | 2019 | 特征级注意力 | 细粒度建模 |
⭐⭐ 强化学习推荐
| 算法 | 年份 | 说明 | 场景 |
|---|---|---|---|
| DRN | 2018 | 深度强化推荐 | 动态推荐 |
| RecSim | 2019 | Google 推荐模拟 | 环境模拟 |
| RecoGym | 2019 | 推荐健身房 | RL 训练 |
🛠️ 工具框架
⭐⭐⭐ 核心库
| 库 | Stars | 说明 | 适用 |
|---|---|---|---|
| Microsoft Recommenders | 12.1k⭐ | 微软最佳实践 | 学习/生产 |
| LightFM | 5.1k⭐ | 混合推荐 | 中小规模 |
| Surprise | 5.1k⭐ | 评分预测 | 学术研究 |
| Implicit | 8.1k⭐ | 隐式反馈 | 大规模 |
| Cornac | 2.1k⭐ | 多算法支持 | 研究对比 |
⭐⭐⭐ 图推荐库
| 库 | Stars | 说明 |
|---|---|---|
| PyTorch Geometric | 25.1k⭐ | 图神经网络 |
| DGL | 15.1k⭐ | 深度图库 |
| RecBole | 5.1k⭐ | 推荐系统库 |
⭐⭐ 工业级框架
| 框架 | 机构 | 说明 |
|---|---|---|
| TensorFlow Recommenders | TF 推荐框架 | |
| PaddleRec | 百度 | 飞桨推荐 |
| XDeepFM | 微软 | 深度交叉 |
| EasyRec | 阿里 | 阿里推荐平台 |
📝 实战教程
⭐⭐⭐ 入门教程
| 教程 | 来源 | 时长 | 说明 |
|---|---|---|---|
| Microsoft Recommenders | Microsoft | 10h | 完整最佳实践 |
| LightFM Tutorial | LightFM | 4h | 混合推荐实战 |
| Surprise Tutorial | Surprise | 3h | 评分预测入门 |
| RecBole Tutorial | RecBole | 6h | 推荐算法库 |
⭐⭐ 进阶教程
| 教程 | 来源 | 时长 | 说明 |
|---|---|---|---|
| Deep Learning RecSys | 8h | 深度学习推荐 | |
| Graph RecSys | PyG | 8h | 图神经网络推荐 |
| Sequential RecSys | SASRec | 6h | 序列推荐 |
| RL RecSys | RecSim | 8h | 强化学习推荐 |
⭐⭐ 项目实战
| 项目 | 难度 | 时长 | 技能点 |
|---|---|---|---|
| 电影推荐 | 🟢 | 4h | 协同过滤 |
| 电商推荐 | 🟡 | 8h | 混合推荐 |
| 新闻推荐 | 🟡 | 10h | 内容 + 协同 |
| 社交推荐 | 🟠 | 12h | 图神经网络 |
| 会话推荐 | 🟠 | 10h | 序列模型 |
🏆 工业实践
⭐⭐⭐ 大厂实践
| 公司 | 系统 | 技术栈 | 规模 |
|---|---|---|---|
| Netflix | 推荐引擎 | MF+DL+RL | 2 亿 + 用户 |
| Amazon | 商品推荐 | Item-CF+DL | 3 亿 + 用户 |
| YouTube | 视频推荐 | Two-Tower+DL | 20 亿 + 用户 |
| Spotify | 音乐推荐 | CF+NLP+Audio | 4 亿 + 用户 |
| TikTok | 内容推荐 | Multi-Task+RL | 10 亿 + 用户 |
| 阿里 | 淘宝推荐 | Multi-Scene+DL | 9 亿 + 用户 |
⭐⭐ 推荐系统架构
用户 → 召回 (千级) → 粗排 (百级) → 精排 (十级) → 重排 → 展示
↓ ↓ ↓ ↓
多路召回 轻量模型 深度模型 业务规则⭐⭐ 关键指标
| 指标 | 说明 | 计算方式 |
|---|---|---|
| CTR | 点击率 | 点击/曝光 |
| CVR | 转化率 | 转化/点击 |
| Recall@K | 召回率 | 命中/总数 |
| NDCG@K | 归一化折损 | 排序质量 |
| MAE/RMSE | 预测误差 | 评分偏差 |
🔬 前沿研究
⭐⭐ 冷启动问题
| 方法 | 年份 | 说明 |
|---|---|---|
| Meta-Learning | 2020 | 元学习冷启动 |
| Graph Meta-Learning | 2023 | 图元学习 |
| Cross-Domain | 2022 | 跨域推荐 |
| DisCo | 2025 | 解耦对比学习 |
⭐⭐ 多模态推荐
| 方法 | 年份 | 说明 |
|---|---|---|
| VBPR | 2016 | 视觉 + 评分 |
| MMGCN | 2019 | 多模态 GCN |
| GRCN | 2020 | 图重构网络 |
⭐⭐ 可解释推荐
| 方法 | 年份 | 说明 |
|---|---|---|
| T-REX | 2020 | 基于规则解释 |
| Explainable GCN | 2021 | 图注意力解释 |
| Counterfactual | 2022 | 反事实解释 |
🎯 学习路径
入门路径 (0-3 个月)
基础理论 (2 周)
- 推荐系统概述
- 协同过滤原理
- 矩阵分解
工具使用 (4 周)
- Surprise/LightFM
- Microsoft Recommenders
- 复现经典算法
实战项目 (6 周)
- 电影评分预测
- 电商商品推荐
- 新闻推荐系统
进阶路径 (3-9 个月)
深入理解 (4 周)
- 深度学习推荐
- 图神经网络
- 序列推荐
工程能力 (8 周)
- 大规模召回
- 实时推荐
- A/B 测试
专项突破 (8 周)
- 选择方向 (召回/排序/重排)
- 阅读工业界论文
- 参与开源项目
最后更新: 2026-04-05
维护: 季度审查,跟踪 RecSys/KDD 最新进展