【学习路线图】深度学习从入门到入土

  1. 1、基础部分
    1. 1-1 数学
    2. 1-2 python
  • 2、机器学习理论入门
  • 3.机器学习实战入门
  • 4.深度学习理论入门
  • 5.深度学习实战入门
  • 6.面试题
  • 参考视频

    三个月从零入门深度学习,保姆级学习路线图
    多篇SCI学长教你如何快速入门深度学习!
    AI学习路线分享|做完这些,你已经成为机器学习方面的专家

    1、基础部分

    1-1 数学

    高数:导数/微分/积分、梯度、泰勒展开公式
    线代:向量、矩阵、运算、范数、特征向量和特征值、泰勒展开公式
    概率论:条件概率、期望

    推荐书籍

    1
    2
    3
    《白话机器学习的数学》
    《机器学习的数学》
    《Mathematics for Machine Learning》

    1-2 python

    1)廖雪峰官网免费教程
    从第一讲看到常用的第三方模块
    2)Python菜鸟教程

    1、Python基础知识
    2、Python函数
    3、Python面向对象编程

    1
    2
    Numpy:Numpy数据类型、Numpy常用函数
    Pandas:Pandas的简洁、Pandas数组属性、Pandas数据处理、Pandas函数

    3)【Python教程】《零基础入门学习Python》小甲鱼

    时间充足可以看下面视频
    (强推)Python面向对象编程五步曲-从零到就业【上】
    (强推)Python面向对象编程五步曲-从零到就业【中】
    (强推)Python面向对象编程五步曲-从零到就业【下】

    4)python实战
    《利用Python进行数据分析》
    《Python编程从入门到实践第3版》

    2、机器学习理论入门

    1)李航老师《统计学习》

    • 三个准则

      1
      2
      3
      作为入门选手,不要每章都看
      不要从零造轮子去实现算法,太浪费时间
      必须能手推公式
    • 必看目录

      1. 统计学习概论
      2. 感知机
      3. 朴素贝叶斯
      4. 决策树
      5. 逻辑回归和最大熵
      6. 提升树
      7. Xgboost完全详细解读(原理+代码)

    2)公式推导:刘建平博客
    代码实现:刘建平github
    【合集】十分钟 机器学习 系列视频 《统计学习方法》
    【机器学习】【白板推导系列】
    3)(强推|双字)2022吴恩达机器学习Deeplearning.ai课程
    《吴恩达机器学习手册》
    4)(强推)李宏毅2021/2022春机器学习课程
    5)(强推)浙江大学-机器学习

    3.机器学习实战入门

    《阿里云天池大赛赛题解析(机器学习篇)》

    开源代码
    四个任务:

    1. 工业蒸汽预测
    2. 天猫用户重复购买预测
    3. O2O优惠券预测
    4. 阿里云安全恶意程序检测

    怎么看:

    1
    2
    3
    4
    5
    6
    7
    8
    有四个任务是吧,你挑其中的一个或者两个,不需要都看,没必要;

    怎么确定把这一个或者两个任务吃透呢?

    七个步骤:赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7个步骤

    四个任务中挑一个或者两个,在一周,七天的话,三天看一个,七天看两个,或者七天你就看一个,
    比如第一个,把它吃透就够了;

    4.深度学习理论入门

    1)李沐《动手学深度学习》

    2)计算机视觉(CV)*

    1
    2
    图像理解:分类、检测、分割、追踪
    图像生成:GAN模型

    课程链接:cs231n
    要求:

    1. 一共33讲,不要都看;作为入门来说,主要是学习p1-p22;

    2. 完成作业:1,2,第三个不用看
      不要自己从零开始做这个作业,直接看代码怎么实现的,理解代码

    3. 学到什么程度?
      反向传播梯度回传,损失函数,优化算法,多层感知机,卷积神经网络,普通的循环神经网络,
      以及一些dropout和BN掌握住

    3)自然语言处理(NLP)

    1
    文本分类、文本匹配、序列标注、文本生成

    课程链接:cs224n
    要求

    1. 一共18讲,看P1-P5和P8,P9,P11;

    2. 完成作业:重点看a1,a2,a4,a5;其实a5这个不做的话,也没问题,把前面给的这个三个一定自己走一遍

    3. 学到什么程度

    通过看这个视频你要能够达到什么地步呢?

    其实这个视频和cs231n在基础部分是重叠的,对于基础部分,大家可以都看,两者兼学会更好

    必须熟悉的掌握:反向传播,词向量,RNN,GRU,Lstm,Seq2Seq以及attention机制;初步了解卷积神经网络;

    4)必看的一本书:
    邱锡鹏《神经网络与深度学习》

    1
    2
    举个例子,比如说看完网络优化和正则化了视频讲解没有搞定;找到这本书对应的章节,
    比如第七章看一遍,邱老师是怎么讲解的;

    5)PyTorch框架学习
    小土堆

    刘二大人源代码

    一个入门学习的仓库:写的非常好,浅显易懂,没有一个多余的代码

    深度学习模型

    1.环境配置:确保你的开发环境满足项目的依赖要求,有些项目可能需要特定的Python版本、特定的库或特定的配置。
    2.数据集:不要局限于配置数据集,这意味着你可以使用任何形状和大小的随机数作为输入, 但请注意,某些模型或算法可能对输入数据的形状和类型有特定的要求。
    3.一行一行感受:这是一种很好的学习方法,可以帮助你理解代码的逻辑和流程。你可以逐行运行代码, 观察每一步的结果,这样可以帮助你更好地理解代码是如何工作的。
    4.错误和异常:在运行代码时,可能会遇到错误或异常,不要害怕这些,它们是学习过程中的一部分,当你遇到问题时,尝试理解为什么会出错,并查找解决方案。
    5.文档和注释:查看项目的文档和注释,这可以帮助你更好地理解代码的功能和工作原理。
    6.测试:尝试修改输入或代码,看看结果如何变化,这样可以帮助你更好地理解代码的健壮性和可变性。

    逐行代码解读

    《PyTorch函数手册》
    6)Tensorflow
    【北京大学】Tensorflow2.0

    5.深度学习实战入门

    要记住我们学习深度学习是为了实战

    两个学习曲线非常平滑的项目:
    一个是新闻分类项目,一个是街景字符识别,也就是图片分类项目,有的人可能会认为这两个项目非常简单,但是我认为千万不要小瞧这两个项目,扎扎实实做完这两个项目,对你的帮助绝对比你想象的要大
    1)自然语言处理-新闻文本分类

    1.赛题解析
    2.分析数据
    3.基于机器学习的文本分类任务
    4.不同深度学习模型:

    1、fastext
    2、Word2vec
    3、CNN 做文本分类
    4、RNN做文本分类
    5、BERT做文本分类-这个可以先不看,等你入了深度学习的门,认为自己想搞NLP这个方向了,你再去看相关的论文

    2)计算机视觉-街景符号识别

    1.赛题理解
    2.数据读取与数据扩增
    3.构建模型
    4.模型的训练与验证
    5.模型的集成

    要求

    1
    2
    必须弄清楚每行代码
    尽情调参

    6.面试题

    《百面机器学习》