第25点,` 在使用均方误差时,模型在预测值远离真实值时,梯度会变得非常小,从而可能导致训练变得缓慢,甚至停滞。 ` 应该是 预测值靠近真实值时 吧