BERT模型直接拿来当作编码部分?