关于特征工程

特征工程和模型选择是提升算法的两类途径。

  • 特征工程:数据清洗,(降维),特征选择,特征组合。
  • 特征组合变换好坏都有,一方面能提高模型的表达能力,另一方面有可能引起过拟合,增加冗余特征,降低模型解释力。
    • 特征变换还可以是将连续特征转换为离散特征。
  • 模型的选择和特征工程是耦合的。因为不同模型对特征工程的需求不一样。
    • 树模型不需要归一化处理,不需要特征选择,因为这些模型都能做到。
    • 神经网络则不需要特征组合变换。
    • 广义线性模型的效果则对数据清洗,特征选择,特征组合很敏感。这就是为啥计算广告领域后续衍生了FM,FFM等等

关于特征工程
http://yoursite.com/2018/12/06/机器学习/关于特征工程/
作者
Wei Lyu
发布于
2018年12月6日
许可协议