序列长度啥啥那几个原因只是背八股这么说 但不是本质原因吧? 对文本序列做跨样本的特征通道的归一会扭曲同一句子内部词和词的结构与语义 这样对文本理解是致命的?