底层还是把富文本转换成markdown格式喂给生图模型吧?