只不过gbdt和xgb是在函数空间优化,梯度下降和牛顿法在参数空间优化