然后短暂的停滞文字转WAV音频