- 探索数据?
 - 数据噪音?
 - 时间特征?
 - 高基数变量?
 - 模型需求多?
 - 如何有效评估模型?
 - 非正态分布?
 - 标准化?
 - LR, RF,GBDT…..使用哪种算法?
 - 项目周期长?
 - 缺失值?
 - 参数配置?
 



			
			
			
			
			
		数十年数据挖掘建模的实战经验,参与和主持过多次国内外银行、保险业数据挖掘项目,屡次带队在国际SAS大赛中获奖。
深刻的数学理解能力、超强的软件实现能力、业界领先的高性能大数据技术。
| 智能建模 | 传统建模 | |
|---|---|---|
| 人数 | 1 | 1 | 
| 建模时间 | 5分钟(数据预处理+建模) | 2个月 | 
| 建模数量 | 1 | 1 | 
| 数据规模 | 100000+ / 28MB | 100000+/ 28MB | 
| 模型AUC | 0.9728(测试集0.965) | 0.957 | 
					
					
					
				| 客群1 | 客群2 | 客群3 | 客群4 | |
|---|---|---|---|---|
| 建模人数 | 1 | 1 | 1 | 1 | 
| 模型数量 | 13 | 13 | 13 | 13 | 
| 建模时间 | 1.5小时/个 | 1.5小时/个 | 1分钟/个 | 2分钟/个 | 
| 数据量 | 134万 | 155万 | 6400 | 1.2万 | 
| 累计提升度 | 累计捕获率 | AUC值 | |
|---|---|---|---|
| 前5% | 14.4 | 72% | >0.9 | 
| 前10% | 9.4 | 94% | |
| 前15% | 6.3 | 94.5% | |
| 前20% | 4.8 | 96% | 
当前该产品购买率为1.72%
| 模型数量 | 时间 | 项目参与人数 | |
|---|---|---|---|
| 智能建模 | 50-60个 | 2周 | 1人 | 
| 手工建模 | 不适合大量建模 | 1周~2个月/个 (实际取决于模型复杂程度和建模人员水平,时间不可控)  | 
				    数人 | 
智能建模改变应用模式:业务用户主导,应用过程中随时随地建模。