我理解的就是和标注工差不多,给数据标注,训练类chatGPT的模型的。chatGPT带火一个概念就是语义对齐,其目的想要生成符合人类理解的3H输出,需要结合人工反馈来强化训练模型。