数据挖掘

WHAT ?这是一门什么样的课程?

预测模型是什么?需要啥样的数据来训练?这么多算法该选哪个?参数又怎么调?啥样的模型才算好?咋样才能建出好模型?
这些问题都会在本课程中解答。这里有数据挖掘技术应用于实际问题所需要的理论知识,还有课堂练习和综合案例。理论与实践结合,学员将对数据挖掘技术与应用方法有足够的理解,出门就能实战。

WHY ? 这种课已经很多,为什么再开一门?

现有的人工智能课程,要么实质上是python编程课,学了语法却不懂算法,建模全凭运气;要么是虚头巴脑的理念讲述,只能听说一些用于忽悠的名词;而真正有内容的算法课,对数学基础要求又太高,一般人听不懂。
我们要做一门面向小白、学完即用的课程。

HOW ? 学了这个课,小白真地就会建模了吗?

能,只要有高中数学知识就可以。
需要强调的是,人生无捷径,这门课不可能让小白深刻理解那么多数据挖掘算法(否则人家统计学博士的十年寒窗就白熬了)。但学会数据挖掘的基本逻辑,借助好的工具就能建模了,还能学会评估模型的好坏,选择调优都不在话下。
建模预测So Easy!

课程目录

  • 第一章 数据挖掘的概念
  • 第二章 数据探索
    • 2.1 数据探索的意义
    • 2.2 确定数据类型
    • 2.3 定量数据探索方法和图形化
    • 2.4 定性数据探索方法和图形化
    • 2.5 变量相关性分析及图形化
  • 第三章 数据预处理
    • 3.1 变量粗筛选
    • 3.2 异常值处理
    • 3.3 缺失值处理
    • 3.4 分类变量处理
    • 3.5 时间变量处理
    • 3.6 数据纠偏
    • 3.7 平衡抽样
    • 3.8 数据标准化
    • 3.9 数据集划分
  • 第四章 建立模型
    • 4.1 监督学习
    • 4.2 常见概念
    • 4.3 线性模型
    • 4.4 树类模型
    • 4.5 集成算法
    • 4.6 深度学习
    • 4.7 自动建模
  • 第五章 模型评估
    • 5.1 分类模型评估
      • 混肴矩阵
      • 准确率表
      • ROC 与 AUC
      • Gini指数 与 KS指标
      • Lift图
      • Recall图
    • 5.2 回归模型评估
      • 模型误差评估
      • 残差图
      • 结果对照图
  • 第六章 模型调优
    • 6.1 衍生变量
      • 数据分箱
      • 特征变量自身变换
      • 结合目标变量的变换
      • 变量交互
      • 比率
      • 日期时间变量
      • 其他
    • 6.2 算法选择和参数调优
      • 算法选择
      • 参数调优
    • 6.3 附录-常见算法参数介绍
  • 第七章 综合案例
    • 7.1 分类模型案例
    • 7.2 回归模型案例

课程观看方法

  1. 登录【乾学院】进入【VIP版】观看课程视频及PDF教程,每天限时1小时(从第一次进入VIP版块开始计时)
  2. 加入【友乾营】看课程视频(不过无法随意调整播放节奏) 如何加入友乾营?
  3. 前往【微店】购买课程的视频和学习材料(PDF完整版电子书+练习数据) 去微店购买学习材料
敲黑板!现在是录制期,方式1尚未正式开始计时,也就是想看多久就可看多久,机不可失,时不再来,抓紧时间点击观看哦……