Skip to content

ForceInjection/hands-on-ML

Repository files navigation

动手学机器学习

动手学机器学习!一个全面的机器学习学习资源库,包含理论讲解、代码实现和实战案例。

1. 项目概述

本项目整合了多个优质的机器学习学习资源:

  • NJU软件学院课程:系统的机器学习理论与实践
  • 上海交大课程:《动手学机器学习》配套资源
  • 特征工程专题:《精通特征工程》实战案例
  • 零基础实战:极客时间机器学习课程

2. 学习路径

2.1 基础概念与数学准备

2.2 监督学习算法

2.2.1 基础监督学习算法

理论学习:

实战案例:

上海交大配套资源:

2.2.2 集成学习

理论学习:

实战案例:

上海交大配套资源:

2.3 无监督学习

2.3.1 聚类算法

理论学习:

上海交大配套资源:

2.3.2 EM算法与高斯混合模型

理论学习:

上海交大配套资源:

2.4 特征工程与模型优化

2.4.1 特征工程

理论学习:

实战案例:

2.4.2 模型评估

2.4.3 模型调优

2.4.4 特征选择

2.4.5 降维算法

理论学习:

上海交大配套资源:

2.5 推荐系统与概率图模型

2.5.1 推荐系统

理论学习:

2.5.2 概率图模型

贝叶斯网络:

隐马尔可夫模型:

上海交大配套资源:

2.6 深度学习

2.6.1 神经网络与深度学习

基础理论:

上海交大配套资源:

3. 实战项目

3.1 Kaggle竞赛实战

3.2 业务场景实战

4. 参考资料

4.1 上海交大《动手学机器学习》

动手学机器学习

课程大纲:

  • 第2章 机器学习的数学基础 | 习题解答
  • 第3章 k近邻算法
  • 第4章 线性回归
  • 第5章 机器学习的基本思想 | 习题解答
  • 第6章 逻辑斯谛回归
  • 第7章 双线性模型
  • 第8章 神经网络与多层感知机
  • 第9章 卷积神经网络
  • 第10章 循环神经网络
  • 第11章 支持向量机
  • 第12章 决策树
  • 第13章 集成学习与梯度提升决策树
  • 第14章 k均值聚类
  • 第15章 主成分分析
  • 第16章 概率图模型
  • 第17章 EM算法
  • 第18章 自动编码器

资源链接:

4.2 NJU 软件学院机器学习课程

课程特色:

  • 课程讲义 - 完整的PDF课件
    • 理论与实践并重的教学方式
    • 丰富的实战案例和代码示例

4.3 《精通特征工程》

精通特征工程

4.4 极客时间《零基础实战机器学习》

零基础实战机器学习

5. 如何使用本项目

5.1 学习建议

  1. 基础准备:先学习基础概念和数学准备部分
  2. 循序渐进:按照章节顺序学习,理论结合实践
  3. 动手实践:每个算法都要运行配套代码
  4. 项目实战:完成Kaggle项目和业务场景实战
  5. 深入理解:对比不同资源的讲解方式,加深理解

5.2 使用技巧

  • 理论学习:先读NJU的理论文档,再看上海交大的Jupyter Notebook
  • 代码实践:运行所有配套代码,修改参数观察结果
  • 项目实战:从简单的Titanic项目开始,逐步挑战复杂项目
  • 笔记整理:建议做学习笔记,记录重点和心得

5.3 环境配置

推荐使用以下环境:

  • Python 3.7+
  • Jupyter Notebook
  • 主要库:numpy, pandas, scikit-learn, matplotlib, seaborn

About

动手学机器学习

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published