则是绷着脸承受着文字转WAV音频