如果两张图像和一个文本的匹配度都很高 应该如何抉择