尽量将对方的外貌记住文字转WAV音频