求楼主翻牌!训练时decoder应该输入什么?比如对话机器人,直接将训练的答句输入吗?计算loss时是使用decoder的输出和decoder的输入比吗?测试的时候decoder又输入什么呢?是规定的句子最大长度的<SOS>或者<EOS>吗(batch_size, seq_max_len)?还是(batch_size, 1)的<SOS>或者<EOS>呢?困扰好几天了,模型已经写好,不知道如何训练,新入坑菜鸟,求翻