关于特征归一化的一些理解

归一化会加快梯度下降法的收敛速度了

这个是显然的,不多说了。

但是这里需要注意的是,像LR这种单纯的梯度下降法求解,只是增加收敛速度罢了,并不会让解更加精确,因为最终这个最优解的系数值是和特征值比例成反比的。

归一化有可能会提升算法精度

注意,这里是可能,因为就像前文所有,对于LR,是不会提升精度的,但是归一化对某些模型也是会提升精度的:

  • 对于KNN(跟梯度下降法无法),需要计算欧式距离,如果不归一化,那么欧式距离就主要取决于大的特征值,从而影响精度。
  • 对于有L1,L2正则的算法,如果不做归一化,那么系数值会受到特征值大小的影响,从而导致值小的特征对应的系数大,从而导致该特征受到影响。

树模型不需要归一化。。。


关于特征归一化的一些理解
http://yoursite.com/2018/11/21/机器学习/关于特征归一化的一些理解/
作者
Wei Lyu
发布于
2018年11月21日
许可协议