评论详情-牛客网

所以xgb收敛速度比gbdt更快(牛顿法收敛速度比梯度下降更快)，为什么不用更高阶的泰勒展开，因为会使损失函数为非凸函数，无法令其导为0