GBDT与RF作为机器学习中最常用的两个集成学习算法,Spark中也有相应的实现。下面是基于Spark 2.1.0 GBDT与RF算法的训练与预测(train/predict)接口实现。
功能:
- train(训练)/train_cv(训练+网格搜索参数优化+交叉验证)/predict(预测)接口
Random Forest算法train/train_cv/predict实现:
|
|
GBDT算法train/train_cv/predict实现:
|
|
Do The Right Thing!
GBDT与RF作为机器学习中最常用的两个集成学习算法,Spark中也有相应的实现。下面是基于Spark 2.1.0 GBDT与RF算法的训练与预测(train/predict)接口实现。
功能:
- train(训练)/train_cv(训练+网格搜索参数优化+交叉验证)/predict(预测)接口
|
|
|
|