训练集里面用了gpt吐出来的语料,算是国产模型通病了