XGBoost和LightGBM调参

有个应用上的重大区别:

  • Xgboost只处理数值特征,因此Xgboost无法直接处理离散特征(categorical feature),需要数据预处理,要么labelEncoder转换为数值特征,当做连续值处理,要么one-hot编码,当做离散值处理。

  • LightGBM则有对离散特征的单独处理,需要首先利用labelEncoder转换为数值,然后会利用On Grouping for Maximum Homogeneity提到的算法找到最优值,是从2^(n-1)-1个分区划分中选出最优optimal split,而不像OHE一样是n个划分,因此效果优于OHE。

    image-20200605155935227


XGBoost和LightGBM调参
http://yoursite.com/2018/12/05/机器学习/Xgboost和LightGBM调参/
作者
Wei Lyu
发布于
2018年12月5日
许可协议