一是容貌与形象文字转WAV音频