gpt是怎么根据录音生成文字的