先用已有数据训一个预测树高度的模型出来,然后按预测值和记录值之差降序排序,取前3%认为是错误数据,可能不是最优,但应该可行