易明智能建模

省钱省时让数据说话

无须数据挖掘技能
无须数据科学家
一键完成建模预测

手工建模

探索数据?
数据噪音?
时间特征?
高基数变量？
模型需求多？
如何有效评估模型？
非正态分布？
标准化？
LR, RF,GBDT…..使用哪种算法？
项目周期长？
缺失值？
参数配置？

VS

易明智能建模

建模流程完全自动进行。一键式建模，又快又好！

无需数据科学家即可建模

建模过程

需要数据科学家完成的众多人工任务

数据输入

建模数据预处理

人工建模

模型表现

模型输出

变数识别
基本统计量产生

异常值处理
缺失值处理
高基数变量处理
数据平滑处理
数值变量智能筛选
添加衍生变量

筛选重要变量

优化设置模型参数

选择建模方法

自动筛选重要变量

自动优化设置模型参数

自动优化选择建模方法

AUC
GINI
MSE
LIFT
KS
RECALL RATE...z

数据输入

数据自动预处理

智能建模

模型表现

模型输出

原本要数据科学家完成的人工任务，智能建模工具一键完成，并确保模型质量和稳定性

易明智能建模过程

1.变量类型识别

2.变量统计

3.自动预处理+建模

4.多种模型评估指标

易明智能建模架构

为什么是我们？

统计学专家毕生追求的呕心力作

数十年数据挖掘建模的实战经验，参与和主持过多次国内外银行、保险业数据挖掘项目，屡次带队在国际SAS大赛中获奖。

研发团队的扛鼎力作

深刻的数学理解能力、超强的软件实现能力、业界领先的高性能大数据技术。

案例：个人信贷违约预测

目标

建立信贷违约模型，给出用户信贷违约概率
给出用户合理的信贷额度
让业务人员根据经验选择数据建模，帮助业务人员接受模型的应用与普及
提高违约客户捕获率

痛点

找到合理的数据维度
高基数与非线性问题对模型的影响
挑选合理的模型或者模型组合
阳性样本少，避免模型过拟合

建模结果对比

	智能建模	传统建模
人数	1	1
建模时间	5分钟（数据预处理+建模）	2个月
建模数量	1	1
数据规模	100000+ / 28MB	100000+/ 28MB
模型AUC	0.9728（测试集0.965）	0.957

模型表现（测试集）

案例：理财产品精准营销

	客群1	客群2	客群3	客群4
建模人数	1	1	1	1
模型数量	13	13	13	13
建模时间	1.5小时/个	1.5小时/个	1分钟/个	2分钟/个
数据量	134万	155万	6400	1.2万

	累计提升度	累计捕获率	AUC值
前5%	14.4	72%	>0.9
前10%	9.4	94%
前15%	6.3	94.5%
前20%	4.8	96%

当前该产品购买率为1.72%

使用模型前5%的数据比不使用模型效果提升 14.4倍购买率。即每一百名精选的客户，可以完成24.77次交易，远高于平均每百名客户成交1.72次。
由模型抓取的前5%的数据中，可以捕获72.0%的目标客户。由模型抓取的前20%的数据中，可以捕获96.0%的目标客户。

智能建模 VS 手工建模

	模型数量	时间	项目参与人数
智能建模	50-60个	2周	1人
手工建模	不适合大量建模	1周~2个月/个（实际取决于模型复杂程度和建模人员水平，时间不可控）	数人

易明智能建模特点

人工智能少人工

自动建模

效率高

非数据科学家

成本低

模型完善

准确率高

智能建模改变应用模式：业务用户主导，应用过程中随时随地建模。

易明智能建模

手工建模

易明智能建模

建模过程

易明智能建模过程

1.变量类型识别

2.变量统计

3.自动预处理+建模

4.多种模型评估指标

易明智能建模架构

为什么是我们？

统计学专家毕生追求的呕心力作

研发团队的扛鼎力作

案例：个人信贷违约预测

目标

痛点

建模结果对比

模型表现（测试集）

案例：理财产品精准营销

智能建模 VS 手工建模

易明智能建模特点

效率高

成本低

准确率高

更多资料